Size: a a a

Natural Language Processing

2021 November 29

FF

Futorio Franklin in Natural Language Processing
Звучит как вариация TextRank
источник

d

dePuff in Natural Language Processing
Не... Я именно про классику.

https://www.youtube.com/watch?v=U0LOSHY7U5Q

Вроде в этом семинаре упоминали, но я не готов морально два часа пересматривать )
YouTube
Практическое занятие по обработке текста в gensim с помощью алгоритма word2vec
Яндекс организует семинар Льва Константиновского, посвящённый обработке текста.
Лев Константиновский — специалист по анализу текста, программирует на Python и Java. Получил большой опыт в финансовых учреждениях. Менеджер исследований и разработки в RaRe Technologies. Также является комьюнити-менеджером в open source проекте Gensim, где участвует в разработке одноимённой библиотеки алгоритмов машинного обучения для понимания естественных языков.
Автор прочтёт практическое введение в обработку текстов, написанных на естественных языках с помощью open source приложения gensim, познакомит участников с теорией алгоритма word2vec. Слушатели смогут научиться автоматически привязывать теги к документам на примере жанров и киносценариев. Также рассмотрят семь разных алгоритмов обработки текста: word2vec, doc2vec и другие.
источник

d

dePuff in Natural Language Processing
Я мог и придумать )
Впервые смотрел про word2vec до того как начал шарить в nlp и вполне мог какой-то параллельно прочитанный способ суммаризации объединить в голове )
источник

A

Andrey in Natural Language Processing
да вроде было. на хабре вроде даже
источник

KS

Konstantin Shitkov in Natural Language Processing
Там вроде была последовательная саммаризация книг по кусочку.
источник

A

Andrey in Natural Language Processing
вот что вспомнилось. про вложение векторов word2vec и многообразия.

tsne по произведениям Толстого.

https://habr.com/ru/company/vk/blog/426113/
источник

A

Alina in Natural Language Processing
Всем привет!
Нам срочно нужен человек, который может за деньги обучить нейронку.

Задача вот такая:

Существует база данных, состоящая из более чем 100к картинок (логотипов).
Предполагается использовать нейросеть для поиска логотипа на сходство и тождество.
Например, я загружаю логотип, а программа должна мне выдать похожие лого из базы

Подскажите, пожалуйста, есть ли у вас/ваших знакомых возможность помочь с этой задачей?
источник

MK

Marianna Kovalova in Natural Language Processing
Логичнее написать в какой-то CV чат. А еще можете посмотреть на сервисы гугла
источник

A

Alina in Natural Language Processing
Большое спасибо!
источник

A

Alexander in Natural Language Processing
Я как-то использовал LDA из sklearn, и все хорошо, но есть две проблемы: 1) нужно задавать количество тем, 2) От запуска к запуску модель выдает то плохие то хорошие результаты (нестабильна). На что можно ее заменить? bertopic не зашел с первого раза
источник

SancheZz Мов in Natural Language Processing
Gensim LDA?
источник

SancheZz Мов in Natural Language Processing
BigArtm
источник
2021 November 30

A

Alexander in Natural Language Processing
О, Gensim, и в правду) Спасибо!)
источник

AN

Andrei Nosov in Natural Language Processing
Добрый вечер,
Может кому-нибудь попадался датасет на немецком, на котором amazon echo обучали, ну или любой другой на немецком кроме QUAD?
источник

A

Andrey in Natural Language Processing
посмотрите milvus, weviate и тому подобное.

https://www.semi.technology/developers/weaviate/current/modules/img2vec-neural.html
источник

SS

Sergey Shulga in Natural Language Processing
Напишите в личку, могу помочь.
источник

AK

Anton Kolonin in Natural Language Processing
Коллеги (@yuri_baburov ?) - кто подскажет где/как "из коробки" быстро получить список словоформ для русских слов (лучше на питоне)? Можно тупо ссылку кинуть для тупых 😊
источник

ТИ

Танненберг Илья... in Natural Language Processing
Pymorphy2, может быть подойдет?
https://pymorphy2.readthedocs.io/en/stable/
источник

AK

Anton Kolonin in Natural Language Processing
Туда и смотрю, но нужна обратная задача - список форм по слову. Такого пока не вижу.
источник

Eg

Elena gisly in Natural Language Processing
он и генерировать может
источник