Size: a a a

спбгеотех

2019 May 18

EK

Eduard Kazakov in спбгеотех
Связываем заведения, где "чекинятся" одни и те же люди. Чекин в широком смысле, это и трансакции, и соц сети, и другие данные
источник

EK

Eduard Kazakov in спбгеотех
источник

EK

Eduard Kazakov in спбгеотех
Слева снизу можно заметить кластеризацию пространства города
источник

EK

Eduard Kazakov in спбгеотех
Разработана целая информационная система, её схему потом посмотрите в презентации
источник

EK

Eduard Kazakov in спбгеотех
Артём о сложностях работы с данными Location Based Social Networks
источник

EK

Eduard Kazakov in спбгеотех
В основном использовали Google Places
источник

EK

Eduard Kazakov in спбгеотех
Один запрос стоит 3 цента
источник

EK

Eduard Kazakov in спбгеотех
В одном запросе максимум 20 объектов
источник

EK

Eduard Kazakov in спбгеотех
В таком раскладе пришлось бы потратить 12000$
источник

o

oneonwar in спбгеотех
Но ведь можно бесплатно
источник

ES

Elena Shestakova in спбгеотех
А вышло 300$
источник

EK

Eduard Kazakov in спбгеотех
Придумали хитрую схему, с привлечением данных foursquare, в итоге получилось немного запросов, в итоге стоило 300$
источник

EK

Eduard Kazakov in спбгеотех
Будем ждать Артёма в чате с пояснениями)
источник

EK

Eduard Kazakov in спбгеотех
Две недели машинного времени на нескольких компьютерах для сбора данных
источник

EK

Eduard Kazakov in спбгеотех
184759 заведений, 2.6 млн комментариев, почти миллион пользователей
источник

ES

Elena Shestakova in спбгеотех
источник

EK

Eduard Kazakov in спбгеотех
Далее система выделения районов на основе чекинов. Строится сеть заведений, всё фильтруется до "позвоночника" графа, затем кластеризуется сеть
источник

EK

Eduard Kazakov in спбгеотех
источник

EK

Eduard Kazakov in спбгеотех
Кластеры. Хороший коэффициент Modularity 0.72
источник

ES

Elena Shestakova in спбгеотех
источник