Size: a a a

Natural Language Processing

2021 March 17

DD

David Dale in Natural Language Processing
Andrei
А есть пример где это соответствие оттуда достаётся?

Например в Hugging Face есть transformer модель facebook/wmt19-en-ru  для перевода. Из неё можно как-то?
У меня чё-то токенайзер от неё не скачивается.
Предлагаю пока что поштырить репозиторий https://github.com/jessevig/bertviz, он красивый
источник

DD

David Dale in Natural Language Processing
Andrei
А есть пример где это соответствие оттуда достаётся?

Например в Hugging Face есть transformer модель facebook/wmt19-en-ru  для перевода. Из неё можно как-то?
Итак, вот тебе блокнот с кросс-атеншном.
Надеюсь, это примерно то, что было нужно)
https://gist.github.com/avidale/85f6b3d294f9ff400ef76f2cc7ec559e
источник

A

Andrei in Natural Language Processing
David Dale
Итак, вот тебе блокнот с кросс-атеншном.
Надеюсь, это примерно то, что было нужно)
https://gist.github.com/avidale/85f6b3d294f9ff400ef76f2cc7ec559e
топово!!! спасибо большое за блокнот! такое и хотел
источник

O

Olya in Natural Language Processing
привет! подскажите, пожалуйста, подходы, тулзы для language detection?
источник

DD

David Dale in Natural Language Processing
Olya
привет! подскажите, пожалуйста, подходы, тулзы для language detection?
fasttext справляется весьма прилично (при том, что модель весит 1мб)
https://fasttext.cc/blog/2017/10/02/blog-post.html
https://fasttext.cc/docs/en/language-identification.html
источник

O

Olya in Natural Language Processing
David Dale
fasttext справляется весьма прилично (при том, что модель весит 1мб)
https://fasttext.cc/blog/2017/10/02/blog-post.html
https://fasttext.cc/docs/en/language-identification.html
спасибо! посмотрю
источник
2021 March 18

v

viktor in Natural Language Processing
Olya
привет! подскажите, пожалуйста, подходы, тулзы для language detection?
вот еще неплохие библиотеки
* https://github.com/aboSamoor/pycld2
* https://github.com/saffsd/langid.py
источник

AK

Aleksey Kulnevich in Natural Language Processing
Тестировал на основных европейских языках, фасттекст показывал результат выше, чем pycld2
источник

SM

Sergei Markoff in Natural Language Processing
Приходите послушать и пообсуждать в эту пятницу) Ссылка: https://bit.ly/3eP1UBw
источник

AA

Ann Akhmetova in Natural Language Processing
Sergei Markoff
Приходите послушать и пообсуждать в эту пятницу) Ссылка: https://bit.ly/3eP1UBw
А будет запись?
источник

SM

Sergei Markoff in Natural Language Processing
Ann Akhmetova
А будет запись?
Будет
источник

AA

Ann Akhmetova in Natural Language Processing
Ура, спасибо!)
источник

НС

Никита Сапунов... in Natural Language Processing
Всем привет. Никак не могу решить простую задачу с yargi. Хочу создать такой факт чтобы там было и исходное и нормализованное слово. Понятно, что это можно сделать как-то отдельно. Но как сделать нормально?
источник
2021 March 19

НК

Николай Карпенко... in Natural Language Processing
David Dale
Итак, вот тебе блокнот с кросс-атеншном.
Надеюсь, это примерно то, что было нужно)
https://gist.github.com/avidale/85f6b3d294f9ff400ef76f2cc7ec559e
а можно эту модель как-то добучать небольшими датасетами?
источник

DD

David Dale in Natural Language Processing
Николай Карпенко
а можно эту модель как-то добучать небольшими датасетами?
Конечно, можно.
Но я сам не пробовал, и какое получится качество - не знаю.
источник

НК

Николай Карпенко... in Natural Language Processing
David Dale
Конечно, можно.
Но я сам не пробовал, и какое получится качество - не знаю.
а какими еще моделями можно переводить  хорошо?
источник

DD

David Dale in Natural Language Processing
Николай Карпенко
а какими еще моделями можно переводить  хорошо?
источник

D

Dmitry in Natural Language Processing
Николай Карпенко
а какими еще моделями можно переводить  хорошо?
машинный перевод? opus-mt-en-ru / ru-en
источник

М

Михаил in Natural Language Processing
Всем привет. Хочу обучить neuralcoref для русского, базируясь на https://github.com/buriy/spacy-ru .
(Spacy 3.0, насколько я понял не подходит)
Есть ли те, кому это удалось сделать?
Есть ли пример датасета для обучения? (В pipeline для английского используется обработанная версия OntoNotes, и не понятен окончательный формат датасета)
источник

IK

Igor Kucherevsky in Natural Language Processing
Olya
привет! подскажите, пожалуйста, подходы, тулзы для language detection?
Нужно определить какой язык?
источник