Size: a a a

Natural Language Processing

2021 November 29

YC

Yury Chernyshov in Natural Language Processing
Так же. Ошибка 104.
источник

YC

Yury Chernyshov in Natural Language Processing
Конфигурация - CentOS на хосте и Ubuntu в контейнере. Nltk нужен в контейнере.
источник

d

dePuff in Natural Language Processing
Не костыль

Родная качалка его тупо в нужную папочку кладёт
источник

ВЧ

Василий Чесалов... in Natural Language Processing
На ubuntu я бы сделал apt-get autoremove на всякий случай, т.е
мусор бы убрал.
источник

d

dePuff in Natural Language Processing
Через apt же только питон ставят
Нечего там autoremove убирать
источник

d

dePuff in Natural Language Processing
Ещё раз повторюсь, что положить ручками или скачать через nltk.download разницы нуль
источник

A

Andrey in Natural Language Processing
всем привет. освежил тут в памяти word2vec/doc2vec. вспомнил про fasttext. и вот вопрос в чем - а в каких кейсах можно заюзать это самое king - man + woman? понятно, чтобы найти понятие или документ, найти близкие или противоположные. но у меня не вяжется с продом что-то никак. я не в поисковике работаю :)

можно конечно классификатор строить, ну там приход от расхода отличить. но это можно сделать и массой других способов.

вот конкретно на алгебре векторов?.. схожие товары?... знаю word2vec бахают для user2vec. но опять же как тут алгебру запользовать, вопрос, кроме downstream tasks.
источник

IG

Ilya Gusev in Natural Language Processing
а зачем вообще в каких-то кейсах это использовать?
источник

IG

Ilya Gusev in Natural Language Processing
само наличие "алгебры" - просто показатель того, что пространство "хорошее"
источник

A

Andrey in Natural Language Processing
а что алгебре пропадать почем зря? векторное пространство хорошая структура. ну не ротор дивергенции считать конечно... но мало ли
источник

IG

Ilya Gusev in Natural Language Processing
ну она не пропадает, просто при использовании векторов в качестве деталек других моделей неявно используется
источник

IG

Ilya Gusev in Natural Language Processing
условно, не нужно руками кодировать WordNet
источник

A

Andrey in Natural Language Processing
а что если взять два разных word2vec и найти переход, кхм, от базиса к базису. вдруг инсайт какой, как социум устроен, ну или хотя бы структуру двух доменов вскрыть можно зная один - другой
источник

A

Andrey in Natural Language Processing
про downstream да, понятно все...
источник

IG

Ilya Gusev in Natural Language Processing
как социум устроен - это вряд ли :) а вот по семантическим сдвигам слов во времни есть много работ
источник

d

dePuff in Natural Language Processing
Можно повернуть вектора на одном языке аналогично векторам другого и будет словарь 😅
источник

A

Andrey in Natural Language Processing
так и иноплатнетян расшифровать можно. а стеночку в магазине... ну или там цены какие?.. иэх.
источник

d

dePuff in Natural Language Processing
Ну и никто не мешает кластеризовать документы по векторам документов
источник

IG

Ilya Gusev in Natural Language Processing
инопланетян опять же вряд ли, а вот переводы на малоресурсные языки вполне можно делать с упомянутым выше выраваниванием векторов из разных языков
источник

ВЧ

Василий Чесалов... in Natural Language Processing
Может быть, для генерации текстов на редком языке, для обучения?
источник