Телеграмм чат группы natural_language_processing страница 518

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1279 membersпожаловаться на группу

2019 December 18

A

Alex in Natural Language Processing

Уважаемые друзья, подскажите, каким инструментом можно приводить словосочетания на русском в более-менее правильный человекочитаемый вид?

Например, дано:
'роза купить гатчина'

Хотелось бы получить:
'купить розу в Гатчине'

заранее благодарен за ответы!

источник

15:11пожаловаться #1

D(

David (ddale) Dale in Natural Language Processing

Уважаемые друзья, подскажите, каким инструментом можно приводить словосочетания на русском в более-менее правильный человекочитаемый вид?

Например, дано:
'роза купить гатчина'

Хотелось бы получить:
'купить розу в Гатчине'

заранее благодарен за ответы!

Я готового инструмента не знаю.
Что можно попробовать сделать: сделать довольно сложную машиннообученную конструкцию, которая бы из кривого словосочетания делала правильное.
Как сделать:
1. Берёшь много "нормальных" фраз, и "портишь" их некоторыми эвристиками
2. На этих данных обучаешь seq-2-seq нейронку с атеншном и копированиями (типа как для перевода), которая переводила бы с "запросного" языка на "обычный".
Вместо голого seq-2-seq'а можно попробовать замутить что-нибудь с синтаксическим разбором (ведь по сути тут надо правильно восстановить связи между словами и на основе этих связей сгенерировать правильное предложение), но у меня такого опыта нет.

источник

15:19пожаловаться #2

m

mel kaye in Natural Language Processing

можно даже без нейронки по идее, просто подбирать деревья по pos

источник

15:23пожаловаться #3

D(

David (ddale) Dale in Natural Language Processing

можно даже без нейронки по идее, просто подбирать деревья по pos

Просто pos недостаточно, а то может выйти "купить гатчину в розе". Нужна всё-таки какая-то модель, куда вшита статистика употребления слов - но да, необязательно нейронка.

источник

15:25пожаловаться #4

m

mel kaye in Natural Language Processing

David (ddale) Dale

Просто pos недостаточно, а то может выйти "купить гатчину в розе". Нужна всё-таки какая-то модель, куда вшита статистика употребления слов - но да, необязательно нейронка.

я и имел ввиду все возможные деревья по конкретному набору pos

источник

15:26пожаловаться #5

m

mel kaye in Natural Language Processing

а дальше можно померять какое из них наиболее правдоподобное, например по частоте биграм в некотором корпусе

источник

15:27пожаловаться #6

DK

Denis Kirjanov in Natural Language Processing

я и имел ввиду все возможные деревья по конкретному набору pos

неоднозначности многовато будет, семантика нужна

источник

15:28пожаловаться #7

D(

David (ddale) Dale in Natural Language Processing

а дальше можно померять какое из них наиболее правдоподобное, например по частоте биграм в некотором корпусе

Ага, звучит норм

источник

15:28пожаловаться #8

A

Alex in Natural Language Processing

Спасибо, буду пробовать!

По предыдущему вопросу: нашлась библиотека для русского языка termextractor, для текущей задачи ее хватило

источник

15:35пожаловаться #9

NK

Nikolay Karelin in Natural Language Processing

Спасибо, буду пробовать!

По предыдущему вопросу: нашлась библиотека для русского языка termextractor, для текущей задачи ее хватило

Это вот эта библиотека: https://github.com/igor-shevchenko/rutermextract ???

источник

15:40пожаловаться #10

AZ

Alexandr Zamaraev in Natural Language Processing

Народ, никому не встречался аналог "Regex Coach" - пошаговой отладки регулярок на python-е?

источник

15:40пожаловаться #11

A

Alex in Natural Language Processing

Nikolay Karelin

Это вот эта библиотека: https://github.com/igor-shevchenko/rutermextract ???

Да

источник

15:43пожаловаться #12

NK

Nikolay Karelin in Natural Language Processing

Alexandr Zamaraev

Народ, никому не встречался аналог "Regex Coach" - пошаговой отладки регулярок на python-е?

Такой: https://pythex.org/ ?

источник

15:45пожаловаться #13

m

mel kaye in Natural Language Processing

Alexandr Zamaraev

Народ, никому не встречался аналог "Regex Coach" - пошаговой отладки регулярок на python-е?

regex101

источник

15:46пожаловаться #14

AZ

Alexandr Zamaraev in Natural Language Processing

Nikolay Karelin

Такой: https://pythex.org/ ?

Не, именно пошаговые. берётся большая регулярка и текст html странички.
И можно смотреть как оно применяется, где откатывается какими частями.
В Regex Coach это великолепно сделано http://www.weitz.de/regex-coach/#step, но диалект несколько свой, да и работает только под виндой..

источник

15:51пожаловаться #15

2019 December 19

D(

David (ddale) Dale in Natural Language Processing

Друзья, а какие готовые модели и датасеты для NLI для русского языка вы использовали? Что посоветуете?
Особенно интересует детекция пар фраз, противоречащих друг другу.

источник

20:28пожаловаться #16

RV

Rinat Valiullov in Natural Language Processing

https://yandex.ru/scholarships/scholars

Стипендия и премия им. Ильи Сегаловича

Научная премия Яндекса им. Ильи Сегаловича

Вручается молодым исследователям и научным руководителям

источник

23:34пожаловаться #17

2019 December 22

AD

Alfredo Diezo in Natural Language Processing

Всем привет!
Кто-нибудь использовал уже предобученные модели на Universal Sentence Encoder с tensorflow или pytorch/text для sentiment analysis?
А то попадаются сплошные гайды с полным пайплайном: от очистки до обучения модели. Нет ли уже натрененных моделей?

источник

16:16пожаловаться #18

CT

Cookie Thief in Natural Language Processing

Всем привет!
Кто-нибудь использовал уже предобученные модели на Universal Sentence Encoder с tensorflow или pytorch/text для sentiment analysis?
А то попадаются сплошные гайды с полным пайплайном: от очистки до обучения модели. Нет ли уже натрененных моделей?

В тф хабе же претрейн модель

источник

17:17пожаловаться #19

CT

Cookie Thief in Natural Language Processing

Или речь о модели, предобученной для сентимента?

источник

17:17пожаловаться #20