Size: a a a

NLP_RU - Natural Language Processing & Text Mining

2018 June 15

AK

Alex Konst in NLP_RU - Natural Language Processing & Text Mining
Это достаточно много как раз
источник

t2

tonko 22 in NLP_RU - Natural Language Processing & Text Mining
точность зависит от задач, 300 это стандартная рекомендация для общего случая
источник

AK

Alex Konst in NLP_RU - Natural Language Processing & Text Mining
Для большого корпуса, скорее. Потому на маленьком такие размерности не обучатся
источник

R

Rogoley in NLP_RU - Natural Language Processing & Text Mining
tonko 22
мешок слов скорее относится к исходным данным для обучения, его в модели нет
Это да, интересует уже то, что модель под категории выбрала, без связи и коэффициентов.
источник

t2

tonko 22 in NLP_RU - Natural Language Processing & Text Mining
Rogoley
Это да, интересует уже то, что модель под категории выбрала, без связи и коэффициентов.
категории для документов это отдельно надо обучать, в pre-trained моделях только признаки слов
источник

пк

пес кібернетичний in NLP_RU - Natural Language Processing & Text Mining
Разобрался с gensim и fasttext, спасибо всем, кто помогал!)
источник

пк

пес кібернетичний in NLP_RU - Natural Language Processing & Text Mining
А что такое частотный порог модели?
источник

пк

пес кібернетичний in NLP_RU - Natural Language Processing & Text Mining
Сильно уж он разнится от модели к модели
источник

t2

tonko 22 in NLP_RU - Natural Language Processing & Text Mining
редкие слова не участвуют в обучении
источник

пк

пес кібернетичний in NLP_RU - Natural Language Processing & Text Mining
tonko 22
редкие слова не участвуют в обучении
Понял
источник

пк

пес кібернетичний in NLP_RU - Natural Language Processing & Text Mining
Gensim нормально подгружает все модели с русвекторс, кроме фасттекста
источник

пк

пес кібернетичний in NLP_RU - Natural Language Processing & Text Mining
Погуглил, нашёл специальный метод для фасттекст моделей, но он тоже исключение бросает
источник

AK

Alex Konst in NLP_RU - Natural Language Processing & Text Mining
Да, gensim работает только с word2vec, кажется
источник

пк

пес кібернетичний in NLP_RU - Natural Language Processing & Text Mining
Alex Konst
Да, gensim работает только с word2vec, кажется
А какой тогда word2vec посоветуешь?
источник

AK

Alex Konst in NLP_RU - Natural Language Processing & Text Mining
Смотря для чего
источник

пк

пес кібернетичний in NLP_RU - Natural Language Processing & Text Mining
Текстогенерация с ЛСТМ и ГАНами
источник

AK

Alex Konst in NLP_RU - Natural Language Processing & Text Mining
Я про корпус твой
источник

t2

tonko 22 in NLP_RU - Natural Language Processing & Text Mining
пес кібернетичний
Погуглил, нашёл специальный метод для фасттекст моделей, но он тоже исключение бросает
Возможно генсим старый, если ставил через pip
источник

пк

пес кібернетичний in NLP_RU - Natural Language Processing & Text Mining
Alex Konst
Я про корпус твой
Модель же ищу
источник

AK

Alex Konst in NLP_RU - Natural Language Processing & Text Mining
Если тот самый, то лучше свою модель обучи
источник