Size: a a a

Natural Language Processing

2021 October 28

Eg

Elena gisly in Natural Language Processing
флудящие — в смысле, сообщения не по основной теме?
источник

TM

Toemik Mnemonic in Natural Language Processing
Наверное я не очень хорошее прилагательное выбрал . Скорее вообще не несущие какого то смысла (н-р «ку-ку» , «эй, епта, отвечай», «алё») + идиотские и неприличные предложения которые пользователи могут отправлять ассистенту
источник

Eg

Elena gisly in Natural Language Processing
список дискурсивных выражений, наверное, можно найти в разметках корпусов. Вот тут есть какие-то дискурсивные формулы: https://pragmaticon.ruscorpora.ru/filters. А именно про разметку диалогов с помощниками не знаю.
источник

TM

Toemik Mnemonic in Natural Language Processing
Спасибо
источник

M

Max in Natural Language Processing
здравствуйте, подскажите, у вас получилось heideltime развернуть? какой репо использовали? у меня что-то ни одна не отрабатывает нормально. вроде поставил -  запускаю код, в колабе вылетает (перезапускается) среда, пытаюсь понять в чем дело...
источник

SS

Sergey Shulga in Natural Language Processing
Аналогично
источник

SS

Sergey Shulga in Natural Language Processing
Не для всех случаев годится
источник

ПП

Павел Приказчиков... in Natural Language Processing
добрый день, нет решили не использовать этот проект, а из ком. строки кажется работало
источник

M

Max in Natural Language Processing
там русский не поддерживается... или неправильно пишу? а не подскажите, чем решили задачу с переводом даты?
источник

V

Vic in Natural Language Processing
рассматриваете аутсорс под НДА?
источник

M

Maksym in Natural Language Processing
Мы рассматриваем возможность нанимать сотрудника как ФЛП, или на Трудовую Книжку в штат компании
источник

ПП

Павел Приказчиков... in Natural Language Processing
для русского нужно что то отдельно скачать, я сейчас не подскажу уже. мы решили через правила решить задачу
источник

ПП

Павел Приказчиков... in Natural Language Processing
java -jar de.unihd.dbs.heideltime.standalone.jar -l RUSSIAN -t NARRATIVES -pos NO -c config.props 1.txt

вывод
Г Москва, <TIMEX3 tid="t2" type="DATE" value="XXXX-09-25">Двадцать пятое сентября</TIMEX3> Две тысячи двадцатого <TIMEX3 tid="t3" type="DURATION" value="P1Y">года</TIMEX3>
источник

M

Max in Natural Language Processing
спасибо!
источник

M

Max in Natural Language Processing
что-то совсем не срабатывает распознавание даты
источник

РА

Роман Арасланов... in Natural Language Processing
Коллеги, есть те, кто работает со Splunk?
источник

D

Danila Milovanov in Natural Language Processing
Не подскажите, какая лицензия у данной модели https://huggingface.co/sberbank-ai/sbert_large_nlu_ru? По идее такая же, как и у оригинального сберта? (Apache 2.0)
источник

SS

Sergey Shulga in Natural Language Processing
Народ, кому-нибудь попадался фильтр цензуры для случаев транслита и визуальной замены? Чтобы ловило вещи типа xyi или hernya или ур0д.. С обычным русским то проблемы в целом нормально решаются, а вот для этого что-то завис.
источник

YB

Yuri Baburov in Natural Language Processing
ну, возьми список плохих слов из фильтра на кириллице и напиши транслитерацию
чтобы заменяла YPоД, ур0д, urod и ur0d на urod
источник

V

Vic in Natural Language Processing
расстояние левенштейна или своя похожая метрика решает вопрос. Всякие такие уловки ен пройдут, хотя видел что во многих системах проходят, видимо разрабы не знают про этот метод))
источник