Size: a a a

2017 March 18

YN

Yaroslav Nikitenko in msk.opendataday
Опубликованы результаты публичных слушаний по правилам землепользования и застройки Москвы.
Это важнейший градостроительный документ, который определяет развитие города до 2035 года!
http://gpinfo.mka.mos.ru/docs/Итог_заключение_ПС_ПЗЗ.pdf
Кто может перевести его в лучший формат, чтобы можно было делать поиск по тексту? По фамилиям или по адресам. Следующая задача - было бы очень интересно узнать, сколько людей поддержали этот проект, сколько выступили против.
источник

YN

Yaroslav Nikitenko in msk.opendataday
Множество жителей и общественных инициатив будут Вам исключительно благодарны.
https://m.facebook.com/story.php?story_fbid=1325421717504021&id=100001086157118
За пересылку информации в другие специализированные группы тоже.
источник

YN

Yaroslav Nikitenko in msk.opendataday
Предпросмотра нет, но в проекте ПЗЗ куча нарушений и больше 100 инициативных групп, движений, организаций, муниципальных депутатов и экспертов выступили категорически против этого проекта как уничтожающего наш город. (ДС, т.к. чат общероссийский)).
источник
2017 March 19

НК

Никита Кузнецов in msk.opendataday
ребят, я тут помогаю обработать вот этот список комментариев на публичных слушаниях, там какой-то беспредел вообще
11000 страниц комментариев в pdf. Если глазами пробежаться, то видно, что всё согласное принимается к сведению, всё несогласное - идёт лесом. Я хочу всё это в цифрах представить и причёсываю сейчас данные
Если кто может присоединиться и работает на python - welcome, пишите мне
источник

НК

Никита Кузнецов in msk.opendataday
также если кто-то может посоветовать либу, которая позволяет как-то учесть позицию текста на странице / структуру таблицы, в которой текст лежит - то буду очень благодарен) пока просто собрал текст из pdf и по содержимому пытаюсь это обратно разделить на колонки
источник

AP

Alex Popkov in msk.opendataday
@NikitaKuznetsov Нужно выдернуть таблицу из pdf?
источник

НК

Никита Кузнецов in msk.opendataday
да, там такой формат
источник

НК

Никита Кузнецов in msk.opendataday
источник

AP

Alex Popkov in msk.opendataday
Посмотри в сторону https://github.com/chezou/tabula-py
источник

AP

Alex Popkov in msk.opendataday
Табула много магии с таблицами, тут основной реп https://github.com/tabulapdf
источник

НК

Никита Кузнецов in msk.opendataday
спасибо, странно, что раньше на неё не нагуглил
источник

AP

Alex Popkov in msk.opendataday
Всегда пожалуйста. Если не получится - пиши в лс, что-нибудь придумаем
источник
2017 March 20

YN

Yaroslav Nikitenko in msk.opendataday
Можно ли потом их таких сообщений вытащить адреса и на карте их отобразить, где сколько замечаний подали?
источник

AP

Alex Popkov in msk.opendataday
Можно
источник

IB

Ivan Begtin in msk.opendataday
А можно потом все выложить в формате открытых данных, например на github или к нам на hubofdata.ru ?
источник

DL

Dada Lyndell 🔪 in msk.opendataday
У кого-то получилось конвертировать ее табулой?
источник

IB

Ivan Begtin in msk.opendataday
Лучше, воспользоваться FineReader'ом или еще одним софтом от Abbyy
источник

IB

Ivan Begtin in msk.opendataday
Если их просить на некоммерческую работу - они и бесплатную лицензию могут дать
источник

DL

Dada Lyndell 🔪 in msk.opendataday
а почему лучше?
источник

DL

Dada Lyndell 🔪 in msk.opendataday
там в основном текст, но видимо, табула его не хочет, потому что там есть картинки. или потому что он слишком большой.
источник