Size: a a a

Open Data Belarus

2019 November 12

PT

Paveł Tyślacki in Open Data Belarus
источник

DR

Dmitry Rogozhny in Open Data Belarus
спасибо
источник

DR

Dmitry Rogozhny in Open Data Belarus
интересно, что в 2012 сайт был vybory2012, а сейчас vybary2019
источник

AB

Anatoli Babenia in Open Data Belarus
vybory2019.by тоже зареган, но DNS сервера у него другие
источник
2019 November 13

AB

Anatoli Babenia in Open Data Belarus
Итак, первые побочные эффекты автоматического парсера. Обнаружено 5 выбывших кандитатов - https://github.com/opendataby/vybary2019/commit/c751f0144995772a25485e8f0ad11adf92c956ae
источник

AB

Anatoli Babenia in Open Data Belarus
Интересно, за них вчера и сегодня успели проголосовать уже? Если да, то куда эти голоса пошли..
источник

AB

Anatoli Babenia in Open Data Belarus
https://github.com/opendataby/vybary2019/blob/master/canal01-generations.ipynb - посчитал миллениалов и поколение зет.
источник

AB

Anatoli Babenia in Open Data Belarus
Интересно, сколько кого проберётся.
источник
2019 November 14

AB

Anatoli Babenia in Open Data Belarus
источник

AB

Anatoli Babenia in Open Data Belarus
Однако, оказывается там есть карты. Но они не отображаются. То ли программистам недоплатили, то ли с копирайтом недоговорились.
источник

GK

Gleb K in Open Data Belarus
карта похожа на государственного производства подложку, Белгеодезиякартография?
источник

AB

Anatoli Babenia in Open Data Belarus
Скоррее всего.
источник

K

KciroohS in Open Data Belarus
В прошлые годы была карта Белкартографии.
источник

AB

Anatoli Babenia in Open Data Belarus
Итаг, сегодня в 18:30 в Малиновом хакерспейсе как минимум соберусь я один, чтобы попрактиковаться в сравнении трёх независимых датасетов и анализе их на pandas. Кроме подчистки данных с помощью скрипта, есть задача вытягивать из полнотекстового описания дату рождения, доход, компанию и является ли она гос. или нет. Можно ещё определение пола прикрутить, если кто знает или умеет как. Если будет совсем непонятно, буду читать доки по pandas, а так можем замутить мастеркласс (или мастерфейл) по работе с данными для всех желающих.
источник

KZ

Kastus Zhu in Open Data Belarus
Вот эта библиотека должна уметь в такие штуки https://github.com/natasha/natasha
источник

AB

Anatoli Babenia in Open Data Belarus
Да, она есть в плане, но там на мове описания, может не справиться.
источник

AB

Anatoli Babenia in Open Data Belarus
Вообще мне кажется задача достаточно простая для тех, кто пайплайны из нейронок собирает.
источник

GK

Gleb K in Open Data Belarus
Anatoli Babenia
Итаг, сегодня в 18:30 в Малиновом хакерспейсе как минимум соберусь я один, чтобы попрактиковаться в сравнении трёх независимых датасетов и анализе их на pandas. Кроме подчистки данных с помощью скрипта, есть задача вытягивать из полнотекстового описания дату рождения, доход, компанию и является ли она гос. или нет. Можно ещё определение пола прикрутить, если кто знает или умеет как. Если будет совсем непонятно, буду читать доки по pandas, а так можем замутить мастеркласс (или мастерфейл) по работе с данными для всех желающих.
источник

AB

Anatoli Babenia in Open Data Belarus
А есть конфликты? Типа Саша и Саша? Как много таких?
источник

GK

Gleb K in Open Data Belarus
в полных паспортных именах не встречал конфликтов. У нас не Германия, где Саша - это имя по паспорту, вроде :)
источник