Size: a a a

Natural Language Processing

2020 August 24

IP

Igor Panteleev in Natural Language Processing
а то может зря даже затеваю эту историю)
источник

KL

Kir L in Natural Language Processing
да, но мы сделали на правилах. Получились if'ы++, разбирали на ярги реплику, доставали показатели, разрезы, даты и т.п. Потом переводили через матрицу соответствия бизнес-термины в язык БД, конструировали запрос на основании полученных сущностей. Даже контекст сделали. Но дальше пока не пошло.
источник

KL

Kir L in Natural Language Processing
как сказал мне М. Бурцев в короткой беседе, сделать нейросетевой nl2sql можно только имея много хороших обучающих данных. Очень много
источник

KL

Kir L in Natural Language Processing
наверно это очевидно, но как бы вот так.
источник

IP

Igor Panteleev in Natural Language Processing
Интересный опыт, спасибо
А упирались в возможности ярги и грамматик? или они в целом полностью решали ваши потребности?
источник

KL

Kir L in Natural Language Processing
скорее успешно, чем нет. Больше всего мне не нравилось, что синоним типа "добыча" и "добыча нефти" обрабатывались через правила тоже, хотелось прикрутить эмбеддинги, но до этого не дошло. Хотя планов о том, как разбавить эти правила моделями была куча, ну, короче, главное - начать )
источник

KL

Kir L in Natural Language Processing
но можно не догнать лидеров BI, я слышал, что в большинство инструментов бизнес-анализа сейчас добавляют возможность вопросов на естественном языке, первым по-моему был MS Power BI, QlickTech недавно кого0то купил, чтобы встраиваться в чат-бота...
источник

AK

Alexander Kukushkin in Natural Language Processing
Лонгрид про проект Natasha на Хабре https://habr.com/ru/post/516098/. Участникам этого чатика можно не читать, почти всё было в закрепе, просто лайк, шер, репост
источник

KL

Kir L in Natural Language Processing
👍
источник

K

Kirill in Natural Language Processing
Датасет Нерусь - норм название)
источник
2020 August 25

χλ

χоρоший ☽☽☽ λисuчко... in Natural Language Processing
Теперь это в закрепе
источник

χλ

χоρоший ☽☽☽ λисuчко... in Natural Language Processing
Получается комментарий отсылает сам на себя 🤔
источник

AP

Alex Peresmeshnik in Natural Language Processing
Лонгрид это что?
источник

DP

Defragmented Panda in Natural Language Processing
Alex Peresmeshnik
Лонгрид это что?
длинный текст
источник

БК

Беслан Курашов... in Natural Language Processing
Alex Peresmeshnik
Лонгрид это что?
длинная статья
источник

χλ

χоρоший ☽☽☽ λисuчко... in Natural Language Processing
Alex Peresmeshnik
Лонгрид это что?
Долго читать
источник

AP

Alex Peresmeshnik in Natural Language Processing
Ох уж эти англицизмы
источник

AW

Alex Wortega in Natural Language Processing
Tl dr
источник

AB

Alexey Burnakov in Natural Language Processing
Привет всем! Почитал на Хабре статью про Natasha, понравилось, респект. Есть такой вопрос, я мучаю новостные тексты на предмет связки должность - ФИО. ФИО выделяется неплохо, затем я его сравниваю со списком важных для нас персон. Загвоздка в том, как поточнее выделить должность, чтобы ее сравнить. Кто-то пробовал вытягивать должности?
источник

AB

Alexey Burnakov in Natural Language Processing
Alexey Burnakov
Привет всем! Почитал на Хабре статью про Natasha, понравилось, респект. Есть такой вопрос, я мучаю новостные тексты на предмет связки должность - ФИО. ФИО выделяется неплохо, затем я его сравниваю со списком важных для нас персон. Загвоздка в том, как поточнее выделить должность, чтобы ее сравнить. Кто-то пробовал вытягивать должности?
Кейсы бывают сложные, например, очень длинные должности "Об этом в четверг сообщил ТАСС заместитель руководителя Федеральной службы по надзору в сфере природопользования (Заместитель руководителя Росприроднадзора) Амирхан Амирханов." В скобках - правильная должность. Пока, кроме простых и плохо работающих эвристик я не смог ничего придумать.
источник