Size: a a a

Natural Language Processing

2017 July 01

AK

Alexander Kukushkin in Natural Language Processing
Добавить поддержку рекурсивных грамматик. Это изменение потянуло за собой много других, поэтому меняется интерфейс. Появится возможность парсить всякие сложные вещи типа
источник

AK

Alexander Kukushkin in Natural Language Processing
источник
2017 July 02

AI

Anna Iashina in Natural Language Processing
Всем привет) хотела поблагодарить разработчиков, ваш инструмент просто находка)
источник

AI

Anna Iashina in Natural Language Processing
а сюда можно задавать тупые вопросы про нормализацию?
источник

DV

Dima Veselov in Natural Language Processing
Да, конечно.
источник

AI

Anna Iashina in Natural Language Processing
есть табличка, куда школьники вписывали имена своих друзей, разумеется в самых различных формах, в каждой ячейке имя. Иногда вписывали не имена, много пропусков, фамилию пишут то в начале, то в конце. Хотелось бы на выходе получать нормализированное имя формата имя + фамилия. Видела пример кода в issues, он мне не помог(
источник

AI

Anna Iashina in Natural Language Processing
проблема еще в том, что я с питоном на Вы, а данных много и ничего лучше не придумалось
источник

DV

Dima Veselov in Natural Language Processing
Можно извлекать объекты (с полями: имя, отчество, фамилия и т.д.), примеры есть тут: https://github.com/bureaucratic-labs/natasha/blob/master/natasha/grammars/person/tests.py#L210
Кроме полей firstname, lastname у объектов есть normalized_firstname, normalized_lastname и т.д. - т.е. слова в нормальной форме (ед. число, им. падеж)
Объекты можно сравнивать между собой (как здесь: https://github.com/bureaucratic-labs/natasha/blob/master/natasha/grammars/person/tests.py#L289), чтобы получить только уникальные
Если не горит, постараюсь расписать это дело чуть подробнее, днем по москве :)
источник

AI

Anna Iashina in Natural Language Processing
Благодарю! Спасибо большое, буду разбираться. В ближайшие дни еще не горит 😁
источник
2017 July 03

DV

Dima Veselov in Natural Language Processing
Если кому-нибудь интересно, вот так решили эту задачу (поиск имен и приведение их в нормальную и полную форму): https://gist.github.com/dveselov/bad5f236aaf4f61486d0708b628ee05c
источник

DL

Dada Lyndell 🔪 in Natural Language Processing
посоветуйте, пожалуйста, что-нибудь для выделения географий из текстов на английском (кроме geograpy, почему-то он не устанавливается). Спасибо!
источник

DV

Dima Veselov in Natural Language Processing
В nltk есть готовые корпуса для английского, http://www.nltk.org/book/ch07.html
Если по каким-то причинам не подойдет, то можно посмотреть в сторону Stanford NER: https://nlp.stanford.edu/software/CRF-NER.shtml
Лучше последнего (из открытых инструментов) наверное ничего нет.
источник

DL

Dada Lyndell 🔪 in Natural Language Processing
Stanford NER тоже не получилось установить (
источник
2017 July 06

АМ

Александр Мамаев in Natural Language Processing
Привет всем! А наташа умеет с английским дружить?
источник

DV

Dima Veselov in Natural Language Processing
Привет. Для этого нужен морфологический корпус для английского языка (которого у нас нет :))
источник

АМ

Александр Мамаев in Natural Language Processing
А чего нибудь подобное на En подсказать можешь?
источник

DV

Dima Veselov in Natural Language Processing
Ну, я выше писал - Stanford NER, например.
источник
2017 July 16

СС

Сергей Соложенцев in Natural Language Processing
Доброго времени суток. Не нашёл как можно обучить наташу поиску собственных токенов, ее предопределённых
источник

АМ

Александр Мамаев in Natural Language Processing
Есть пункт документация там отдельная глава про это
источник

АМ

Александр Мамаев in Natural Language Processing
источник