Size: a a a

Natural Language Processing

2021 November 19

IG

Ilya Gusev in Natural Language Processing
тут как будто бы есть несколько вариантов:
1) Взять первые K токенов каждого документа, положить их через сепаратор, классифицировать как один документ
2) Посчитать для каждого документа эмбеддинг фиксированной сеткой, сделать любой пулинг этих эмбеддингов с головой на классификацию
3) Сделать суммаризацию каждого документа, goto 1
4) Отобрать самые представительные документы любым способом (тематическое моделирование, кластеризация), goto 1
5) Руками настрогать фичей и мета-фичей по документам, обучить классификатор
источник

D

Dima in Natural Language Processing
Спасибо за ответ
источник

B

Banof in Natural Language Processing
🔫 Марта кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@wadimiusz, @andapka, @oleg_mosalov, @Mifody, @shulga_sergey
При поддержке Золота Бородача
источник

B

Banof in Natural Language Processing
🔫 А кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@LoneGeek, @cointegrated, @couldbeanybody, @AlexPushkina, @Kirili4ik
При поддержке Золота Бородача
источник

B

Banof in Natural Language Processing
🔫 Раким кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@wadimiusz, Nikita, Nikita, @Spiralhead, @gislygisly
При поддержке Золота Бородача
источник
2021 November 20

VM

Victor Maslov in Natural Language Processing
а есть какая-нить тулза, чтоб из текста имейла убирала начало
"\n\nHello, nakilon!\n"

и конец
"Cheers,\nthe team\n\n---\n\nThis notification is automated. Don't respond\n. All rights reserved.\n\n--\n\nView message on the web: https://..."

и оставляла только середину?
источник

KS

Konstantin Smith in Natural Language Processing
В pullenti есть анализатор MailAnalyzer, который разбирает структуру: обращение, тело, подпись, а также вложенные письма (ответы).
источник

VG

Vladimir Grigoryev in Natural Language Processing
Регулярные выражения?
источник

VM

Victor Maslov in Natural Language Processing
не хочется для каждого отдельного рассыльщика изобретать регексп
источник

VM

Victor Maslov in Natural Language Processing
интересно
правда их демо-страница на моем контенте у них просто белеет полностью
источник

VM

Victor Maslov in Natural Language Processing
о, у пулленти на сайте есть раздел "другие системы" и там чот про имейлы есть
источник

KS

Konstantin Smith in Natural Language Processing
На сайте этого анализатора нет, это надо скачать демо стенд под windows, и на нем выбрать этот анализатор.
источник

VM

Victor Maslov in Natural Language Processing
понял
источник

KS

Konstantin Smith in Natural Language Processing
Скачать с этого сайта со станицы загрузки
источник

V

Vic in Natural Language Processing
запись нужна..
источник

B

Banof in Natural Language Processing
🔫 @AdalgisaKlaus кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@LoneGeek, @bazhanRO, @dzhkn42, @couldbeanybody, @rostel
При поддержке Золота Бородача
источник

SM

Sergei Markoff in Natural Language Processing
источник

SM

Sergei Markoff in Natural Language Processing
Это с прошлой недели. С сегодняшнего будет через неделю примерно.
источник

V

Vic in Natural Language Processing
Забрали, спасибо
А скажите кому бы написать по Airi, у нас тоже есть идея разработки памяти для трансформеров, но не той что сейчас а ассоциативной. Хотелось бы как отдельный проект быть как бы примыкающий к лаборатории Сбера. Можно так организоваться?
источник

SM

Sergei Markoff in Natural Language Processing
Мише Бурцеву напишите
источник