Size: a a a

спбгеотех

2019 December 11

EB

Evgeniy Baryshkov in спбгеотех
Ilya Levashev
суть в том, чтобы из говна и палок получить не говно и палки))

А конкренее, чтобы понять какие здания без тегов жилые, какие являются местами работы людей(БЦ, школы, заводы, ТЦ и т.д.), а какие к людям имеют косвенное значение (подстанции, КПП всякие, остановки и т.д.)
Классная задача, не удивлюсь, если ее можно найти на kaggle :)

Думаю, хорошего подхода (простыми способами) в принципе не найти, из-за того, что даже человеку по прямым признакам понять сложно -- жилое здание или нет.
Тем не менее, попробуй открыть какой-нибудь спутник на Гугле или Яндексе и проанализировать, на основании каких ПРЯМЫХ признаков ты сам можешь отнести здание к тому или иному классу.

Вот, что я бы попробовал: набрал бы как можно больше разных признаков. Кроме очевиденых (площадь, этажность...), более экзотические:
* отношение полной площади к внешнему периметру (у школ и детсадов обычно очень сложная геометрия (т.е. большой P), когда как жилых зданий форма проще)
* наличие "островов" в полигоне дома
Кроме прямых признаков, ддостаточно просто обратить внимание на окружение здания другими зданиями. Например, если рядом  со зданием есть нежилые здания, но нет жилых, маловероятно,что оно таки жилое.
Чем больше у тебя времени, тем больше признаков напридумывай :)
Взял бы выборки с известным классом здания. Посмотрел бы корреляцию с разными признаками.

Дальше выкинуть плохие признаки, засунуть это в какой-нибудь непространственный алгоритм кластеризации (для начала). Посмотреть сколько классов и как нашлось. Потом уже по результатам.

Да, я не настоящий сварщик, анализом данных занимался оч мало.
Вообще советую спросить этот вопрос в каком-нибудь чатике ML-щиков
источник

EB

Evgeniy Baryshkov in спбгеотех
Но все это вилами по воде, конечно. В качестве примера, мой любимый дом в петербурге: единственный жилой дом в сердце промзоны на Косой линии.

Тут и человек бы не справился, какой уж алгоритм
источник

IL

Ilya Levashev in спбгеотех
Ну это можно в рамках погрешности проигнорировать))
источник

EB

Evgeniy Baryshkov in спбгеотех
Ilya Levashev
Ну это можно в рамках погрешности проигнорировать))
Это понятно, просто я вот боюсь, что такой погрешности будет процентов 50 :)
источник

IL

Ilya Levashev in спбгеотех
Да((
источник

IL

Ilya Levashev in спбгеотех
Подскажите чат ML-щиков?
источник

IL

Ilya Levashev in спбгеотех
Evgeniy Baryshkov
Это понятно, просто я вот боюсь, что такой погрешности будет процентов 50 :)
с другой стороны, тут может сыграть руку строгое функциональное зонирование
источник

EB

Evgeniy Baryshkov in спбгеотех
Ilya Levashev
с другой стороны, тут может сыграть руку строгое функциональное зонирование
Ты говорил про школы, и ТЦ, с ними это не очень прокатит. По крайней мере со школами и детсадами точно
источник

IL

Ilya Levashev in спбгеотех
они как раз по форме должны выйти в большинстве своём
источник

EB

Evgeniy Baryshkov in спбгеотех
Ilya Levashev
Подскажите чат ML-щиков?
Я хорошего не знаю(
Думаю, можешь просто в самый крупный написать
источник

EB

Evgeniy Baryshkov in спбгеотех
Надо пробовать :)
источник

AS

Alexander Semenov in спбгеотех
Ilya Levashev
Подскажите чат ML-щиков?
источник

AB

Anton [az09@osm] Belichkov in спбгеотех
Ilya Levashev
Подскажите чат ML-щиков?
https://github.com/goq/telegram-list где-то тут наверняка есть
источник

o

oneonwar in спбгеотех
там их дохуя так то
источник

NV

Natalya Volgusheva in спбгеотех
oneonwar
там их дохуя так то
Попрошу не выражаться, спасибо.
источник

IL

Ilya Levashev in спбгеотех
Спасибо)
источник

p

palladdiumm in спбгеотех
Ilya Levashev
Спасибо)
Вы для себя подобную задачу решаете?)
источник

IL

Ilya Levashev in спбгеотех
А какие есть варианты?)
источник

p

palladdiumm in спбгеотех
Ilya Levashev
А какие есть варианты?)
Варианты есть всегда:)
источник

p

palladdiumm in спбгеотех
Ilya Levashev
А какие есть варианты?)
Как я понимаю, это нечто вроде классификации зданий на основании их формы и тд, верно?
источник