Size: a a a

Natural Language Processing

2017 April 13

B

Beka in Natural Language Processing
Здраствуйте
источник

B

Beka in Natural Language Processing
я хотел сделать NER для казахского языка
источник

B

Beka in Natural Language Processing
можете помочь
источник

B

Beka in Natural Language Processing
я джуниор
источник

B

Beka in Natural Language Processing
Beka
Здраствуйте
Здравствуйте*
источник
2017 April 15

KB

Kirill Bulgakov in Natural Language Processing
Доброго времени суток
Столкнулся с проблемой при запуске примеров из документации:
>'ascii' codec can't decode byte 0xbb in position 0: ordinal not in range(128)
При добавлении u перед анализируемым текстом ошибок нет, но часть текста в консоли не декодируется нормально
источник

DV

Dima Veselov in Natural Language Processing
Привет. Это проблемы python второй версии - можно начать использовать третью версию или искать что-нибудь вроде python unicode console output. А строки с префиксом u - это юникод и парсер понимает только его.
источник

KB

Kirill Bulgakov in Natural Language Processing
Благодарю
источник

NT

Nick Turusin in Natural Language Processing
Dima Veselov
# coding: utf-8
from __future__ import unicode_literals
такое вот еще
источник

KB

Kirill Bulgakov in Natural Language Processing
Смена версии notebook на 3ю помогла, спасибо ещё раз
источник

AK

Alexander Kukushkin in Natural Language Processing
Прошу посмотреть патч для адресов https://github.com/bureaucratic-labs/natasha/pull/14 . Поддержка не идеальная, но для моих практических задач вроде бы достаточная. Чтобы разбирать адреса пришлось кое как решить проблему с OR https://github.com/bureaucratic-labs/yargy/pull/15 . По-моему с текущим парсером не получится полностью нормально поддержать OR и рекурсивные грамматики в целом. В прочем, как сделать правильно я тоже не знаю.
источник
2017 April 16

DV

Dima Veselov in Natural Language Processing
@alexkuk Спасибо! По поводу парсера: скорее всего я буду менять его на какой-нибудь CYK, как у ребят из hurmining, т.к. он гораздо проще для понимания.
источник
2017 April 17

AK

Alexander Kukushkin in Natural Language Processing
Мне тут стал известен пример использования natasha для социальной задачи. В Москве недавно был какой-то передел земли, формально спросили мнение горожан и все 50000 ответов выложили в открытый доступ https://drive.google.com/open?id=0B7jIXURkeWzicUpTNUgxUU9ZRmc . Активисты стали анализировать эти тексты. В частности Наташей извлекли упоминания адресов, нанесли их на карту https://www.google.com/maps/d/viewer?mid=1bY7POQZTeGehVK9eYYpY5-iSmH0&ll=55.81958759001084%2C37.52233937817391&z=12 . Увидели, что в Тушино, Строгино и Щукино одни положительные отзывы
источник

S

Shine in Natural Language Processing
клево :)
источник

DV

Dima Veselov in Natural Language Processing
Alexander Kukushkin
Мне тут стал известен пример использования natasha для социальной задачи. В Москве недавно был какой-то передел земли, формально спросили мнение горожан и все 50000 ответов выложили в открытый доступ https://drive.google.com/open?id=0B7jIXURkeWzicUpTNUgxUU9ZRmc . Активисты стали анализировать эти тексты. В частности Наташей извлекли упоминания адресов, нанесли их на карту https://www.google.com/maps/d/viewer?mid=1bY7POQZTeGehVK9eYYpY5-iSmH0&ll=55.81958759001084%2C37.52233937817391&z=12 . Увидели, что в Тушино, Строгино и Щукино одни положительные отзывы
Ого, круто! А где можно прочитать публикацию (если есть)?
источник

AK

Alexander Kukushkin in Natural Language Processing
Не, нет публикации и наверное не будет. Всё равно все эти комментарии уже проигнорировали
источник

DV

Dima Veselov in Natural Language Processing
Dima Veselov
Ого, круто! А где можно прочитать публикацию (если есть)?
Ещё хочется узнать чем определяли тональность, если не секрет, опять же.
источник

DV

Dima Veselov in Natural Language Processing
Жаль ):
источник

AK

Alexander Kukushkin in Natural Language Processing
Тональность по ключевым словам подобранным вручную
источник
2017 April 20

AP

Andrei Popov in Natural Language Processing
Если кому-то интересно, hurmining на FactRuEval выступал под кодом Green
источник