Телеграмм чат группы natural_language

Доброго времени суток
Столкнулся с проблемой при запуске примеров из документации:
>'ascii' codec can't decode byte 0xbb in position 0: ordinal not in range(128)
При добавлении u перед анализируемым текстом ошибок нет, но часть текста в консоли не декодируется нормально

источник

17:08пожаловаться #6

DV

Dima Veselov in Natural Language Processing

Привет. Это проблемы python второй версии - можно начать использовать третью версию или искать что-нибудь вроде python unicode console output. А строки с префиксом u - это юникод и парсер понимает только его.

источник

17:11пожаловаться #7

KB

Kirill Bulgakov in Natural Language Processing

Благодарю

источник

17:12пожаловаться #8

NT

Nick Turusin in Natural Language Processing

Dima Veselov

# coding: utf-8
from __future__ import unicode_literals

такое вот еще

источник

17:12пожаловаться #9

KB

Kirill Bulgakov in Natural Language Processing

Смена версии notebook на 3ю помогла, спасибо ещё раз

источник

17:27пожаловаться #10

AK

Alexander Kukushkin in Natural Language Processing

Прошу посмотреть патч для адресов https://github.com/bureaucratic-labs/natasha/pull/14 . Поддержка не идеальная, но для моих практических задач вроде бы достаточная. Чтобы разбирать адреса пришлось кое как решить проблему с OR https://github.com/bureaucratic-labs/yargy/pull/15 . По-моему с текущим парсером не получится полностью нормально поддержать OR и рекурсивные грамматики в целом. В прочем, как сделать правильно я тоже не знаю.

GitHub

[WIP] Грамматики для номеров домов, корпусов, строений и литер by alexanderkuk · Pull Request #14 · bureaucratic-labs/natasha

Патч в процессе разработки. Прошу посмотреть на характер добавлений в целом. Что-то такое ожидается для разбора адресов? Например, можно обратить внимание на то, как сделана STREET_GRAMMAR. Также я...

источник

17:43пожаловаться #11

2017 April 16

DV

Dima Veselov in Natural Language Processing

@alexkuk Спасибо! По поводу парсера: скорее всего я буду менять его на какой-нибудь CYK, как у ребят из hurmining, т.к. он гораздо проще для понимания.

источник

11:23пожаловаться #12

2017 April 17

AK

Alexander Kukushkin in Natural Language Processing

Мне тут стал известен пример использования natasha для социальной задачи. В Москве недавно был какой-то передел земли, формально спросили мнение горожан и все 50000 ответов выложили в открытый доступ https://drive.google.com/open?id=0B7jIXURkeWzicUpTNUgxUU9ZRmc . Активисты стали анализировать эти тексты. В частности Наташей извлекли упоминания адресов, нанесли их на карту https://www.google.com/maps/d/viewer?mid=1bY7POQZTeGehVK9eYYpY5-iSmH0&ll=55.81958759001084%2C37.52233937817391&z=12 . Увидели, что в Тушино, Строгино и Щукино одни положительные отзывы

источник

15:18пожаловаться #13

S

Shine in Natural Language Processing

клево :)

источник

15:38пожаловаться #14

DV

Dima Veselov in Natural Language Processing

Alexander Kukushkin

Мне тут стал известен пример использования natasha для социальной задачи. В Москве недавно был какой-то передел земли, формально спросили мнение горожан и все 50000 ответов выложили в открытый доступ https://drive.google.com/open?id=0B7jIXURkeWzicUpTNUgxUU9ZRmc . Активисты стали анализировать эти тексты. В частности Наташей извлекли упоминания адресов, нанесли их на карту https://www.google.com/maps/d/viewer?mid=1bY7POQZTeGehVK9eYYpY5-iSmH0&ll=55.81958759001084%2C37.52233937817391&z=12 . Увидели, что в Тушино, Строгино и Щукино одни положительные отзывы

Ого, круто! А где можно прочитать публикацию (если есть)?

источник

15:45пожаловаться #15

AK

Alexander Kukushkin in Natural Language Processing

Не, нет публикации и наверное не будет. Всё равно все эти комментарии уже проигнорировали

источник

15:46пожаловаться #16

DV

Dima Veselov in Natural Language Processing

Dima Veselov

Ого, круто! А где можно прочитать публикацию (если есть)?