Size: a a a

Natural Language Processing

2020 May 20

V

Vanya in Natural Language Processing
Definitely Not Peter Capaldi
Есть ли у python готовые библиотеки, для обработки естественного языка?
Интересует следующий кейс:
На вход подаётся строка "в пятницу, в 18:45", а на выход - дата ( 22.05.2020 18:45). Или
"В следующую пятницу в 17:56" - 29.05.2020 17:56
Проблема в том, что пользователь может по-разному формулировать дату и время (как напрямую задать дату, вроде "22 мая, в 17:56", так и назвать день недели. Есть ли готовые решения, которые это обрабатывают?
Наташа такое не умеет, я для одного проекта свой парсер писал на ярги
источник

SP

Sebastian Pereira in Natural Language Processing
Definitely Not Peter Capaldi
Есть ли у python готовые библиотеки, для обработки естественного языка?
Интересует следующий кейс:
На вход подаётся строка "в пятницу, в 18:45", а на выход - дата ( 22.05.2020 18:45). Или
"В следующую пятницу в 17:56" - 29.05.2020 17:56
Проблема в том, что пользователь может по-разному формулировать дату и время (как напрямую задать дату, вроде "22 мая, в 17:56", так и назвать день недели. Есть ли готовые решения, которые это обрабатывают?
dateparser
источник

SP

Sebastian Pereira in Natural Language Processing
источник

KS

Konstantin Smith in Natural Language Processing
Definitely Not Peter Capaldi
Есть ли у python готовые библиотеки, для обработки естественного языка?
Интересует следующий кейс:
На вход подаётся строка "в пятницу, в 18:45", а на выход - дата ( 22.05.2020 18:45). Или
"В следующую пятницу в 17:56" - 29.05.2020 17:56
Проблема в том, что пользователь может по-разному формулировать дату и время (как напрямую задать дату, вроде "22 мая, в 17:56", так и назвать день недели. Есть ли готовые решения, которые это обрабатывают?
pullenti может как абсолютные даты\время вычислять, так и относительные даты и диапазоны (классом DateExToken), причём для относительных есть функция вычисления точного значения относительно ккакого-либо времени.
источник

SP

Sebastian Pereira in Natural Language Processing
Konstantin Smith
pullenti может как абсолютные даты\время вычислять, так и относительные даты и диапазоны (классом DateExToken), причём для относительных есть функция вычисления точного значения относительно ккакого-либо времени.
Кстати да, python порт - отличный. Но, я так понял, по коммерческой лицензии надо напрямую к @ksmith )
источник

KS

Konstantin Smith in Natural Language Processing
Sebastian Pereira
Кстати да, python порт - отличный. Но, я так понял, по коммерческой лицензии надо напрямую к @ksmith )
Бесплатно для некоммерческого использования
источник
2020 May 21

KK

Konstantin K in Natural Language Processing
Definitely Not Peter Capaldi
Есть ли у python готовые библиотеки, для обработки естественного языка?
Интересует следующий кейс:
На вход подаётся строка "в пятницу, в 18:45", а на выход - дата ( 22.05.2020 18:45). Или
"В следующую пятницу в 17:56" - 29.05.2020 17:56
Проблема в том, что пользователь может по-разному формулировать дату и время (как напрямую задать дату, вроде "22 мая, в 17:56", так и назвать день недели. Есть ли готовые решения, которые это обрабатывают?
Такие даты словами и числами умеют хорошо разбирать duckling и runer, к которым можно стучаться по api из python
источник

R

Rishi in Natural Language Processing
Anyone knows a good multi-domain dataset with 5 sentiment classes tagged in it?
источник

R

Rishi in Natural Language Processing
Sentiment classes could be Very Negative, Negative, Neutral, Positive and Very Positive.
источник

R

Rishi in Natural Language Processing
I want to build a sentiment classifier which will predict one of the above 5 classes.
источник

А

Александр in Natural Language Processing
Rishi
Anyone knows a good multi-domain dataset with 5 sentiment classes tagged in it?
источник

SS

Sergey Shulga in Natural Language Processing
Народ, а что есть из инструментов для следующей задачи - на вход приходит ФИО в произвольном порядке (ФИО/ФИ/ИОФ), нужно понять, что в строке Ф, что И, а что О
источник

СУ

Сергей Устьянцев... in Natural Language Processing
Sergey Shulga
Народ, а что есть из инструментов для следующей задачи - на вход приходит ФИО в произвольном порядке (ФИО/ФИ/ИОФ), нужно понять, что в строке Ф, что И, а что О
А контекст какой-то есть или только эти три сущности?
источник

SS

Sergey Shulga in Natural Language Processing
Сергей Устьянцев
А контекст какой-то есть или только эти три сущности?
контекста нет, чистый стринг, в котором находится ФИО, при этом это ФИО иногда бывает не в именительном падеже (встречается дательный и родительный)
источник

СУ

Сергей Устьянцев... in Natural Language Processing
ну я бы делал NER на свёртках и, возможно, CRF на выходе. Но кто-то может решит что это избыточно.
источник

СУ

Сергей Устьянцев... in Natural Language Processing
вообще можно Наташу на этой задаче попробовать, скорей всего затащит
источник

SS

Sergey Shulga in Natural Language Processing
А Наташа разве выделяет элементы? Мне казалось, дергает только ФИО в целом.
источник

YB

Yuri Baburov in Natural Language Processing
Sergey Shulga
Народ, а что есть из инструментов для следующей задачи - на вход приходит ФИО в произвольном порядке (ФИО/ФИ/ИОФ), нужно понять, что в строке Ф, что И, а что О
словарь на 95-99% решит, особенно если падежей нагенерировать через pymorphy2.
источник

YB

Yuri Baburov in Natural Language Processing
Yuri Baburov
словарь на 95-99% решит, особенно если падежей нагенерировать через pymorphy2.
и если опечаток нет
источник

СУ

Сергей Устьянцев... in Natural Language Processing
да, тоже думал про словарь, но он вряд ли полноту обеспечит
источник