Size: a a a

Natural Language Processing

2020 June 03

V

Vlad in Natural Language Processing
Подскажите пожалуйста, есть ли что-то готовое для русского языка для согласования числительных? Не просто "2$ - 2 доллара", а например "2 вкусная булочка - 2 вкусные булочки", в идеале бы ещё с переводом чисел в текст в нужной форме конечно, но хотя бы что-то)
источник

D(

David (ddale) Dale in Natural Language Processing
Vlad
Подскажите пожалуйста, есть ли что-то готовое для русского языка для согласования числительных? Не просто "2$ - 2 доллара", а например "2 вкусная булочка - 2 вкусные булочки", в идеале бы ещё с переводом чисел в текст в нужной форме конечно, но хотя бы что-то)
Я готового не знаю, делал велосипед из синтаксического парсера (рекомендую natasha) для выявления связей между словами, и pymorphy2 для собственно склонения.
источник

NS

Nikolay Shmyrev in Natural Language Processing
источник

YB

Yuri Baburov in Natural Language Processing
Vlad
Подскажите пожалуйста, есть ли что-то готовое для русского языка для согласования числительных? Не просто "2$ - 2 доллара", а например "2 вкусная булочка - 2 вкусные булочки", в идеале бы ещё с переводом чисел в текст в нужной форме конечно, но хотя бы что-то)
для согласования с одним словом-существительным -- много решений. Со словосочетанием -- нету
источник
2020 June 04

KS

Konstantin Smith in Natural Language Processing
Vlad
Подскажите пожалуйста, есть ли что-то готовое для русского языка для согласования числительных? Не просто "2$ - 2 доллара", а например "2 вкусная булочка - 2 вкусные булочки", в идеале бы ещё с переводом чисел в текст в нужной форме конечно, но хотя бы что-то)
В pullenty это реализовано в статическом классе MiscHelper,  и словосочетания, и задание чисел словами.
источник

V

Vlad in Natural Language Processing
Понял, спасибо всем, буду изучать и пробовать)
источник

N

Niko in Natural Language Processing
Ребята, вопрос касательно nucleus sampling и top-k sampling для задач генерации текста. Существует ли какой-то общий подход к тому, как выбирать параметры k (в top-k sampling) и p (probability mass в nucleus sampling)? Какая между ними зависимость? Пока что мне кажется, что единственный путь - эмпирически подбирать нужные значения как будто если бы это были гиперпараметры, но, может, есть какие-то общие 'рекомендации', наблюдения и т.п.?
источник

SL

Satish Luintel in Natural Language Processing
Hello everyone. I need some ideas to detect fluency, nativeness in the voices of Candidates like they do in English tests. Any ideas where should I look please?
источник

DP

Dolley P in Natural Language Processing
Satish Luintel
Hello everyone. I need some ideas to detect fluency, nativeness in the voices of Candidates like they do in English tests. Any ideas where should I look please?
U might try for phoneme model I guess
источник

DP

Dolley P in Natural Language Processing
Hello everyone can someone please suggest me similarity  text algorithms please
источник

SL

Satish Luintel in Natural Language Processing
Dolley P
U might try for phoneme model I guess
can you give me more details please? you can dm me if you like to.
источник

SL

Satish Luintel in Natural Language Processing
Dolley P
Hello everyone can someone please suggest me similarity  text algorithms please
I use turnitin to check for plagiarism. They're a huge business, and their solution currently checks for exact words, and sentences that are replaced by synonyms... this is how far they have gone.

So, I'm not sure what you are looking for exactly. Similarity as in same sentences, or to find synonyms?
источник

АП

Антон Помещенко... in Natural Language Processing
e
источник

YB

Yuri Baburov in Natural Language Processing
Satish Luintel
Hello everyone. I need some ideas to detect fluency, nativeness in the voices of Candidates like they do in English tests. Any ideas where should I look please?
questions about voices — better ask in t.me/speech_recognition .
источник

SL

Satish Luintel in Natural Language Processing
thanks, i'll post there.
источник

DK

Denis Kirjanov in Natural Language Processing
David (ddale) Dale
Я готового не знаю, делал велосипед из синтаксического парсера (рекомендую natasha) для выявления связей между словами, и pymorphy2 для собственно склонения.
а какой в Наташе синтаксический парсер, есть метрики?
источник

D(

David (ddale) Dale in Natural Language Processing
Denis Kirjanov
а какой в Наташе синтаксический парсер, есть метрики?
Метрики есть в https://github.com/natasha/slovnet
Все дальнейшие вопросы - к @alexkuk
источник

DK

Denis Kirjanov in Natural Language Processing
а зачем тогда Наташу брать?) солидный проигрыш диппавлову, и по сути ноздря в ноздрю с удпайпом в зависимости от сегмента
источник

D(

David (ddale) Dale in Natural Language Processing
Denis Kirjanov
а зачем тогда Наташу брать?) солидный проигрыш диппавлову, и по сути ноздря в ноздрю с удпайпом в зависимости от сегмента
Диппавлов для прода толстоват, имхо.
А вообще это очень дело вкуса; я ни на чём не настаиваю)
источник

DK

Denis Kirjanov in Natural Language Processing
David (ddale) Dale
Диппавлов для прода толстоват, имхо.
А вообще это очень дело вкуса; я ни на чём не настаиваю)
без гпу совсем толстоват, факт
источник