Size: a a a

Natural Language Processing

2020 July 02

NK

Nikolay Karelin in Natural Language Processing
Sergey Sikorskiy
Общественность не желает забанить этого наглого спамера?
+
источник

A

Alexey in Natural Language Processing
Роман Некрасов
Посмотри модель USE, готовый colab-ноутбук под твою задачу. На tensorflow-хабе лежит.
Роман Спасибо за прекрасную наводку. Посмотрел USE - universal-sentence-encoder-multilingual. Модель Выдает Embedding для любого из 16 языков. Я паравильно понимаю, что получаем эмбединги для русского и английского назавания, а потом на них обучаем нейросеть?
источник

РН

Роман Некрасов... in Natural Language Processing
Alexey
Роман Спасибо за прекрасную наводку. Посмотрел USE - universal-sentence-encoder-multilingual. Модель Выдает Embedding для любого из 16 языков. Я паравильно понимаю, что получаем эмбединги для русского и английского назавания, а потом на них обучаем нейросеть?
Да, верно. Но по-хорошему модель из коробки решит задачу без тонкой настройки с учителем
источник

FF

Futorio Franklin in Natural Language Processing
Мне лично кажется, что здесь use как из пушки по воробьям. Так как он предназначен для кодирования предложений и нахождения близких по смыслу. Тут же информации очень мало, по сути два слова
источник

РН

Роман Некрасов... in Natural Language Processing
Futorio Franklin
Мне лично кажется, что здесь use как из пушки по воробьям. Так как он предназначен для кодирования предложений и нахождения близких по смыслу. Тут же информации очень мало, по сути два слова
Тогда альтернатива FastText, статичные эмбеддинги. Из коробки 3 строки в Пайтоне.
источник

AB

Arcady Balandin in Natural Language Processing
Word2vec для английского в простом формате: измерение - величина
И с учётом омонимов где взять? Просто уже обученный
источник

DK

Dmitri Kapustin in Natural Language Processing
Я думаю тут не словами, нужно оперировать, а символами ,так как обычно русское название компании это перевод с английского 20-40 символов. Соответственно делать общий словарь символов и сравнивать два названия на выходе. Модель сравнивалки называлась Siamese Networks
источник

FF

Futorio Franklin in Natural Language Processing
Согласен, мне кажется можно попробовать просто tfidf на нграммах с svm
источник

FF

Futorio Franklin in Natural Language Processing
получаем матрицу 2 x (много) вытягиваем в 1 x 2 * (много) и закидываем в svm бинарный классификатор
источник

FF

Futorio Franklin in Natural Language Processing
Осталось только засемплировать похожие и непохожие пары
источник
2020 July 03

YB

Yuri Baburov in Natural Language Processing
Abdulhadi Darwish
So don't buy it
@banofbot
Paid materials promotion.
источник

B

Banof in Natural Language Processing
👼 Abdulhadi Darwish спасен — в этот раз его не кикнули.

Проголосовавшие за спасение:
@acherepkov, @andreqwert, @hitmaker, @BobaZooba, @euphinell
источник

D•

Dan • Captain in Natural Language Processing
Коллеги, прежде чем принимать такие решения изучите вопрос чуть более детально.
источник

D•

Dan • Captain in Natural Language Processing
Абдулхади не просто рассказал о курсе, он и есть автор этого курса.
источник

D•

Dan • Captain in Natural Language Processing
И прежде чем судить его, нужно хотя бы ознакомиться с его трудами.
источник

D•

Dan • Captain in Natural Language Processing
Вы можете похвастаться курсом по NLP ?
источник

YB

Yuri Baburov in Natural Language Processing
Dan • Captain
И прежде чем судить его, нужно хотя бы ознакомиться с его трудами.
купив?
источник

D•

Dan • Captain in Natural Language Processing
Yuri Baburov
купив?
Разве там нет пары бесплатных занятий? Пробных, так сказать?
источник

YB

Yuri Baburov in Natural Language Processing
не, смотрите сами, кто-то предложил кикнуть. я бота запустил. голосуйте теперь.
источник

YB

Yuri Baburov in Natural Language Processing
Dan • Captain
Разве там нет пары бесплатных занятий? Пробных, так сказать?
посмотрел. в них пересказ документации какой-то.
источник