Телеграмм чат группы natural_language_processing страница 667

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1588 membersпожаловаться на группу

2020 May 21

SS

Sergey Shulga in Natural Language Processing

Сергей Устьянцев

вообще можно Наташу на этой задаче попробовать, скорей всего затащит

проверил, работает на простых ФИО, но в некоторых случаях ладно бы ничего не выдавала, но выдает не правильные маркеры. Пример: "Ковалю Сергею Александровичу" -выдает {'first': 'Сергей', 'last': 'Александрович'} Что очевидно неправильно.

источник

13:06пожаловаться #1

СУ

Сергей Устьянцев... in Natural Language Processing

CNN+CRF

источник

13:07пожаловаться #2

SS

Sergey Shulga in Natural Language Processing

мда, скорее всего ner-парсер по PER косячит, первый спан ловит не с первого символа

источник

13:09пожаловаться #3

PG

Prohor Gladkikh in Natural Language Processing

как вариант, разделить на три слова и скормить классификатору по очереди. классификатор обучить на каком-то словаре. классификатор, например: n-gram по символам + cnn

источник

13:53пожаловаться #4

YB

Yuri Baburov in Natural Language Processing

проверил, работает на простых ФИО, но в некоторых случаях ладно бы ничего не выдавала, но выдает не правильные маркеры. Пример: "Ковалю Сергею Александровичу" -выдает {'first': 'Сергей', 'last': 'Александрович'} Что очевидно неправильно.

нет, неочевидно, есть фамилия Александрович .

источник

14:11пожаловаться #5

YB

Yuri Baburov in Natural Language Processing

библиотека считает фразу "Ковалю Сергею Александровичу" эквивалентом фразы "Говорю Сергею Петрову"

источник

14:12пожаловаться #6

KS

Konstantin Smith in Natural Language Processing

Проверка ФИО - нетривиальная задача, мне её приходилось решать пару лет назад для контроля ввода ФИО. И здесь в чистом виде никакое NER не поможет для получения хорошего качества. Даже для "русских" ФИО встречаются типа "Иванова Анна Мария Луиза Ивановна", не говоря уж о восточных арабесках. Ну и возможны ошибки в словах. Я из Pullenti использовал класс PersonItemToken для получения последовательности токенов, а далее поверх этого реализовывал разные эвристические правила. Удалось добиться хорошего качества "99.9%" на большой выборке реальных данных ввода.

источник

14:19пожаловаться #7

SS

Sergey Shulga in Natural Language Processing

Konstantin Smith

Проверка ФИО - нетривиальная задача, мне её приходилось решать пару лет назад для контроля ввода ФИО. И здесь в чистом виде никакое NER не поможет для получения хорошего качества. Даже для "русских" ФИО встречаются типа "Иванова Анна Мария Луиза Ивановна", не говоря уж о восточных арабесках. Ну и возможны ошибки в словах. Я из Pullenti использовал класс PersonItemToken для получения последовательности токенов, а далее поверх этого реализовывал разные эвристические правила. Удалось добиться хорошего качества "99.9%" на большой выборке реальных данных ввода.

Уже засел за pullenti, буду заново велосипед изобретать.

источник

14:22пожаловаться #8

SS

Sergey Shulga in Natural Language Processing

У меня ФИО со всей России

источник

14:22пожаловаться #9

KS

Konstantin Smith in Natural Language Processing

Уже засел за pullenti, буду заново велосипед изобретать.

Если не получится - обращайтесь.

источник

14:23пожаловаться #10

SS

Sergey Shulga in Natural Language Processing

Konstantin Smith

Если не получится - обращайтесь.

Спасибо! Сначала сам покапаюсь, если будут тормоза, обязательно обращусь

источник

14:24пожаловаться #11

R

Rishi in Natural Language Processing

Александр

check in https://datasetsearch.research.google.com

Could not find it there

источник

22:45пожаловаться #12

А

Александр in Natural Language Processing

Rishi

Could not find it there

What about kaggle datasets?

источник

22:47пожаловаться #13

R

Rishi in Natural Language Processing

Александр

What about kaggle datasets?

Difficult to find there too.

источник

22:48пожаловаться #14

2020 May 22

D(

David (ddale) Dale in Natural Language Processing

Всем приветики!
Поделитесь, пожалуйста, кто какие диалоговые менеджеры использует для goal-oriented ботов?

За время работы в Алисе я привык к примерно следующему стеку (он неплохо описан в посте авторства Бори Янгеля):

- Запрос пользователя, как он есть;
- Разобранный запрос с выделенным интентом, слотами и сущностями - то, что лингвисты называют semantic frame
- "Состояние диалога", или форма, в виде мешка переменных. Помимо слотов из запроса, там есть слоты, унаследованные из предыдущего диалога, притянутые из профиля пользователя или из внешних источников;
- ???
- Интерфейс, посылающий запросы в ручки тех сервисов, которые собственно и делают вашего бота полезным, и передающий их ответы в бота;
- Профит.

И вот что именно должно быть на месте знаков вопроса - не очевидно.
В Алисе в большинстве сценариев используется нехитрый dialog manager, который или сразу выдаёт ответ, определяемый текущим интентом, или дозапрашивает необходимые слоты (типа "куда вы хотите поехать?").

Проблема в том, что иногда для заполнения слота нужно выполнить отдельную цепочку действий. В Алисе, например, может состояться такой диалог:
- Вызови такси
- Куда вы хотите поехать?
- Домой
- А где находится дом?
- Красная площадь 1
- Ваш адрес - Красная площадь дом один, верно?
- Да
- Заказываю от адреса 3-я улица Строителей дом 25 до адреса Красная площадь дом 1, стоимость 350 рублей...

В этом примере сценарий запоминания адреса "вложен" в сценарий заказа такси. И вот в общем случае может существовать целый стек таких вложенных задач, необходимых для решения основной задачи. А плюс к основной задаче, у бота могут быть дополнительные - например, втюхать юзеру какую-нибудь услугу или собрать с него какой-нибудь фидбек. И отвлекаясь на вспомогательные задачи, надо не забывать про основную, и по возможности - про дополнительные.

И теперь собственно вопрос: как вы управляете задачами бота, когда их становится больше, чем одна?
Если вы пользуетесь готовым фреймворком для этого, будет клёво, если поделитесь текстом/видосом, где он разбирается.
Если вы накодили какой-то свой удачный велосипед, будет особенно любопытно послушать рассказ про его принципы 🙂

источник

12:41пожаловаться #15

NS

Nikolay Shmyrev in Natural Language Processing

David (ddale) Dale

Всем приветики!
Поделитесь, пожалуйста, кто какие диалоговые менеджеры использует для goal-oriented ботов?

За время работы в Алисе я привык к примерно следующему стеку (он неплохо описан в посте авторства Бори Янгеля):

- Запрос пользователя, как он есть;
- Разобранный запрос с выделенным интентом, слотами и сущностями - то, что лингвисты называют semantic frame
- "Состояние диалога", или форма, в виде мешка переменных. Помимо слотов из запроса, там есть слоты, унаследованные из предыдущего диалога, притянутые из профиля пользователя или из внешних источников;
- ???
- Интерфейс, посылающий запросы в ручки тех сервисов, которые собственно и делают вашего бота полезным, и передающий их ответы в бота;
- Профит.

И вот что именно должно быть на месте знаков вопроса - не очевидно.
В Алисе в большинстве сценариев используется нехитрый dialog manager, который или сразу выдаёт ответ, определяемый текущим интентом, или дозапрашивает необходимые слоты (типа "куда вы хотите поехать?").

Проблема в том, что иногда для заполнения слота нужно выполнить отдельную цепочку действий. В Алисе, например, может состояться такой диалог:
- Вызови такси
- Куда вы хотите поехать?
- Домой
- А где находится дом?
- Красная площадь 1
- Ваш адрес - Красная площадь дом один, верно?
- Да
- Заказываю от адреса 3-я улица Строителей дом 25 до адреса Красная площадь дом 1, стоимость 350 рублей...

В этом примере сценарий запоминания адреса "вложен" в сценарий заказа такси. И вот в общем случае может существовать целый стек таких вложенных задач, необходимых для решения основной задачи. А плюс к основной задаче, у бота могут быть дополнительные - например, втюхать юзеру какую-нибудь услугу или собрать с него какой-нибудь фидбек. И отвлекаясь на вспомогательные задачи, надо не забывать про основную, и по возможности - про дополнительные.

И теперь собственно вопрос: как вы управляете задачами бота, когда их становится больше, чем одна?
Если вы пользуетесь готовым фреймворком для этого, будет клёво, если поделитесь текстом/видосом, где он разбирается.
Если вы накодили какой-то свой удачный велосипед, будет особенно любопытно послушать рассказ про его принципы 🙂

rasa, не?

источник

12:44пожаловаться #16

D(

David (ddale) Dale in Natural Language Processing

Nikolay Shmyrev

rasa, не?

Rasa как вариант :)
На какие конкретные расовские policies вы рекомендуете обратить внимание для работы с вложенными и множественными задачами?
Может быть, есть какие-нибудь сочные примерчики?

источник

12:47пожаловаться #17

NS

Nikolay Shmyrev in Natural Language Processing

David (ddale) Dale

Rasa как вариант :)
На какие конкретные расовские policies вы рекомендуете обратить внимание для работы с вложенными и множественными задачами?
Может быть, есть какие-нибудь сочные примерчики?

https://blog.rasa.com/its-about-time-we-get-rid-of-intents/

The Rasa Blog: Machine Learning Powered by Open Source

It's About Time We Get Rid of Intents | Alan Nichol

We’ve made a bunch of progress towards level 3 conversational AI but to really get there, we have to stop relying on intents.

источник

12:48пожаловаться #18

D(

David (ddale) Dale in Natural Language Processing

Nikolay Shmyrev

https://blog.rasa.com/its-about-time-we-get-rid-of-intents/

The Rasa Blog: Machine Learning Powered by Open Source

It's About Time We Get Rid of Intents | Alan Nichol

We’ve made a bunch of progress towards level 3 conversational AI but to really get there, we have to stop relying on intents.

Интересно, спасибо :)

источник

12:49пожаловаться #19

AA

Aleksey Aleksey in Natural Language Processing

Здравствуйте. Ещё не особо разобрался как вытаскивать именованные сущности.
В новой версии natasha, я так понял нужно использовать MorphVocab, но если его использовать, то выбираются не только имена, но и остальные ненужные слова.
Как сделать, чтобы были только имена?

источник

13:42пожаловаться #20