Size: a a a

Natural Language Processing

2021 March 19

IK

Igor Kucherevsky in Natural Language Processing
Если так, то библиотека polyglot
источник

Р

Ромаша in Natural Language Processing
David Dale
fasttext справляется весьма прилично (при том, что модель весит 1мб)
https://fasttext.cc/blog/2017/10/02/blog-post.html
https://fasttext.cc/docs/en/language-identification.html
а что может определять смешанные языки? Например рекомендуемая моделька на фразу

"Arena - это текстовая MMORPG с пошаговыми боями между реальными пользователями Telegram. "

отдает "{'en': 0.12450417876243591, 'ca': 0.08594832569360733, 'de': 0.0802881047129631}"
источник

N

Natalia in Natural Language Processing
Ромаша
а что может определять смешанные языки? Например рекомендуемая моделька на фразу

"Arena - это текстовая MMORPG с пошаговыми боями между реальными пользователями Telegram. "

отдает "{'en': 0.12450417876243591, 'ca': 0.08594832569360733, 'de': 0.0802881047129631}"
эмм, а как вы себе это представляете?
источник

N

Natalia in Natural Language Processing
особенно по такому примеру, где аббревиатуры вообще не специфические
источник

N

Natalia in Natural Language Processing
как себе представляете - в смысле какой должен быть результат классификации
источник

Р

Ромаша in Natural Language Processing
Natalia
эмм, а как вы себе это представляете?
представляю, что вот именно это фраза больше к русскому относится (русских слов больше), нежели к en
источник

N

Natalia in Natural Language Processing
ну значит, модель что-то как-то косячит или смешно обучена (можно посмотреть, на чём обучали и как)
источник

N

Natalia in Natural Language Processing
полиглот или ещё какая-то?
источник

Р

Ромаша in Natural Language Processing
Natalia
полиглот или ещё какая-то?
источник

N

Natalia in Natural Language Processing
ну я бы по приколу потестила разные тогда: https://towardsdatascience.com/benchmarking-language-detection-for-nlp-8250ea8b67c (и полиглот). почему фасттекст так странно рассчитывает - интересный вопрос, конечно
источник

Р

Ромаша in Natural Language Processing
Natalia
ну я бы по приколу потестила разные тогда: https://towardsdatascience.com/benchmarking-language-detection-for-nlp-8250ea8b67c (и полиглот). почему фасттекст так странно рассчитывает - интересный вопрос, конечно
спасибо за ссылку, попробую)
источник

IK

Igor Kucherevsky in Natural Language Processing
from langdetect import detect_langs
foreign = 'Arena - это текстовая MMORPG с пошаговыми боями между реальными пользователями Telegram'
detect_langs(foreign)
источник

IK

Igor Kucherevsky in Natural Language Processing
[ru:0.9999978585694292]
источник

IK

Igor Kucherevsky in Natural Language Processing
Вот еще
источник

Р

Ромаша in Natural Language Processing
Igor Kucherevsky
from langdetect import detect_langs
foreign = 'Arena - это текстовая MMORPG с пошаговыми боями между реальными пользователями Telegram'
detect_langs(foreign)
ваш пример, действительно, показывает правду)
я тестил вот это https://github.com/dkajtoch/fast-lang
источник
2021 March 20

d

dimakarp1996 in Natural Language Processing
Как у pycharm открыть local history для удаленного репозитория? Или как открыть код, который запущен и крутится, но удален?
источник
2021 March 21

AO

Alex Ololo in Natural Language Processing
всем привет, как-то натыкался не понимая давно давно на фейки с голосом. тобишь даешь текст и нейронка, как я понимаю, генерирует аудио голосом нужного перса. где про это почитать и разобраться. есть ли какие то предобученные штуки? есть ли способы заматчить с нужным именно мне голосом. поделитесь линком,  
спс
источник

N

Nikolay in Natural Language Processing
Alex Ololo
всем привет, как-то натыкался не понимая давно давно на фейки с голосом. тобишь даешь текст и нейронка, как я понимаю, генерирует аудио голосом нужного перса. где про это почитать и разобраться. есть ли какие то предобученные штуки? есть ли способы заматчить с нужным именно мне голосом. поделитесь линком,  
спс
источник

AO

Alex Ololo in Natural Language Processing
спасиб посмотрю
источник

Н

Настя Обрезкова... in Natural Language Processing
Привет!)
Хочу попросить о помощи разобраться в синтаксических парсерах, встретиться лично или в скайпе, готова заплатить! Очень нужна консультация в преддверие защиты ВПР 😞
источник