Size: a a a

Natural Language Processing

2020 February 18

YB

Yuri Baburov in Natural Language Processing
Aragaer
какого размера словарь для этого?
ну, spacy, когда используется в режиме без векторов, делает CNN hash embeddings размера 2000-7000 (x3 слоя) и всё.
источник

A

Aragaer in Natural Language Processing
размера в смысле в гигабайтах
источник

YB

Yuri Baburov in Natural Language Processing
а fasttext можно квантизовать или считать только н-граммы.
источник

YB

Yuri Baburov in Natural Language Processing
посмотрел, в spacy по 4 мб модели без векторов.
источник

A

Aragaer in Natural Language Processing
а для русского есть?
источник

AK

Alexander Kukushkin in Natural Language Processing
Aragaer
а для русского есть?
Для русского есть компактные https://github.com/natasha/navec
источник

A

Aragaer in Natural Language Processing
ок, 50 мегабайт это терпимо
источник

YB

Yuri Baburov in Natural Language Processing
Aragaer
а для русского есть?
вектора или что для русского есть?
целевая модель говорю на 4 мб, вектора 0 весят
https://github.com/buriy/spacy-ru/tree/v2.1/notebooks/training
а вот тут есть тренировка своих моделей разных типов (в бранче 2.1)
но да, лучше взять квантизованные вектора из navec.
источник

A

Aragaer in Natural Language Processing
интересно. Я по-моему spacy смотрел несколько лет назад, тогда русского не было
источник

YB

Yuri Baburov in Natural Language Processing
Aragaer
интересно. Я по-моему spacy смотрел несколько лет назад, тогда русского не было
в spacy v1 делали какую-то русскую модель, а для 2.0 я сделал года полтора назад где-то.
но тебе же не POS/NER нужна, а своя классификация поди.
источник

A

Aragaer in Natural Language Processing
я предполагаю следующее - из фразы выцепить сначала интент, потом через таггер выделить параметры для этого интента. И еще параллельно выяснить sentiment, который там тоже может быть
источник

YB

Yuri Baburov in Natural Language Processing
а не хочешь взять rasa на пробу?
источник
2020 February 19

V

Vlad in Natural Language Processing
Очень похоже на то, что rasa nlu вам очень зайдёт
источник

A

Aragaer in Natural Language Processing
да, когда я ее пробовал, зашла. Но там тоже не было русского и модели были на сотни мегабайт
источник