Size: a a a

Natural Language Processing

2020 July 08

SS

Sergey Sikorskiy in Natural Language Processing
источник

B

Banof in Natural Language Processing
🔫 Jerry Fernald кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@LoneGeek, @kasha131, @babdulla, @VladasLapinskas, @euphinell
источник

ЯЗ

Я — пехотинец Владим... in Natural Language Processing
Что там было? Бетховены?
источник

SS

Sergey Sikorskiy in Natural Language Processing
Религия, опиум для народа.
источник

AK

Alexander Kukushkin in Natural Language Processing
Выложили ламповый стрим с Диалога:
https://youtu.be/fcp98T3pjIg?t=278 — про Russian SuperGLUE в дополнение к https://habr.com/ru/company/sberbank/blog/506058/
https://youtu.be/fcp98T3pjIg?t=5259 — про NeoML плюс к https://habr.com/ru/company/abbyy/blog/506808/
источник
2020 July 09

T

Trisha Sinha in Natural Language Processing
I am new to NLP and interested in learning it. What are the prerequisites for the same?
источник

AA

Alexey Antonov in Natural Language Processing
Всем привет!
Никто не занимался задачей определения тональности в диалогах? Может какие устоявшиеся подходы, либо инструменты для этого есть?
источник

AI

Andrew Ishutin in Natural Language Processing
источник

AA

Alexey Antonov in Natural Language Processing
Спасибо! Но насколько я понимаю - это продукт. Интересуют больше либы, которые есть в открытом доступе. А также какая математика для этого используется.
источник

AI

Andrew Ishutin in Natural Language Processing
Я не припоминаю, чтобы были какие-то исследования именно про диалоги, а не про текст в целом.
источник

AI

Andrew Ishutin in Natural Language Processing
источник

YB

Yuri Baburov in Natural Language Processing
Alexey Antonov
Спасибо! Но насколько я понимаю - это продукт. Интересуют больше либы, которые есть в открытом доступе. А также какая математика для этого используется.
https://github.com/bureaucratic-labs/dostoevsky есть из либ для русского
источник

AA

Alexey Antonov in Natural Language Processing
Спасибо
источник

MT

Mikhail Tikhomirov in Natural Language Processing
@alexkuk Добрый день, а Вы когда словарь новый учили, делали это с помощью bpe? WordPiece? Инициализировали матрицу эмбедингов схожим с RuBERT способом? (когда существующим токенам давались эмбединги готовые, а для новых, там были варианты, но например случайная инициализация)
источник

AK

Alexander Kukushkin in Natural Language Processing
Mikhail Tikhomirov
@alexkuk Добрый день, а Вы когда словарь новый учили, делали это с помощью bpe? WordPiece? Инициализировали матрицу эмбедингов схожим с RuBERT способом? (когда существующим токенам давались эмбединги готовые, а для новых, там были варианты, но например случайная инициализация)
В slovnet словарь из rubert, срез 50к сабтокенов которые чаще встречаются в новостях. Матрица копия rubert
источник

MT

Mikhail Tikhomirov in Natural Language Processing
Понял, новую токенизацию не проводили. Хотелось бы поинтересоваться, не было попыток сделать новую токенизацию (которая будет лучше "ложиться" на новости) потому что руки не дошли, или в этом смысла мало?
источник

AK

Alexander Kukushkin in Natural Language Processing
Какие-то попытки были, по-моему мало смысла
источник

A

Aragaer in Natural Language Processing
а я еще тут похвастаюсь. Сделал на flair сетку чтобы наименования товаров из чека превращать в категории типа мясо/овощи/консервы. 200 строк хватило, чтобы выдавать очень неплохие результаты.
источник

A

Aragaer in Natural Language Processing
200 строк данных в смысле
источник

FF

Futorio Franklin in Natural Language Processing
Aragaer
а я еще тут похвастаюсь. Сделал на flair сетку чтобы наименования товаров из чека превращать в категории типа мясо/овощи/консервы. 200 строк хватило, чтобы выдавать очень неплохие результаты.
тюнингом или с нуля?
источник