Size: a a a

Natural Language Processing

2021 March 01

D

Dmitry in Natural Language Processing
А как лучше саммаризрвать короткие тексты? Находить факты?
источник

Lyubov К. in Natural Language Processing
Привет! Подскажите address extractor работает?
источник

AK

Alexander Kukushkin in Natural Language Processing
Kir L
друзья, я правильно понимаю, что Наташа умеет делать из Кирюши Кирилла, или нет? (
Не умеет
источник

AK

Alexander Kukushkin in Natural Language Processing
Lyubov К.
Привет! Подскажите address extractor работает?
Проверьте версию библиотеки, должна быть >= 1.0

Пример импорта https://nbviewer.jupyter.org/github/natasha/natasha/blob/master/docs.ipynb#Natasha , пример использования https://nbviewer.jupyter.org/github/natasha/natasha/blob/master/docs.ipynb#AddrExtractor
источник

VR

Vladimir R in Natural Language Processing
Danila Milovanov
Нашёл только решения для предобученных моделей. А мне нужно обучать с нуля. Может кстати есть какие-то полезные статьи для обучения моделей doc2vec.
У Fasttext есть тренировка с нуля, пожалуйста, посто нужен большой массив текста и много времени, а в результате получишь по сути тоже самое решение как уже готовую модель
источник

SK

Sasha Korovii in Natural Language Processing
Здравствуйте кто-то делал real-time кластеризацию новостей? Сейчас использую BERT(multilang) поверх заголовков для формирования векторов, и Faiss для сохранения и поиска по векторам. Но иногда новости похожие по смыслу, но вектора сильно отличаются. Для сравнения использую косинусное расстояние.
источник

CT

Cookie Thief in Natural Language Processing
Sasha Korovii
Здравствуйте кто-то делал real-time кластеризацию новостей? Сейчас использую BERT(multilang) поверх заголовков для формирования векторов, и Faiss для сохранения и поиска по векторам. Но иногда новости похожие по смыслу, но вектора сильно отличаются. Для сравнения использую косинусное расстояние.
Лучше попробуйте взять мультияз USE вместо берта
источник

SK

Sasha Korovii in Natural Language Processing
Cookie Thief
Лучше попробуйте взять мультияз USE вместо берта
Можна ссилку на USE?
источник

CT

Cookie Thief in Natural Language Processing
Sasha Korovii
Можна ссилку на USE?
источник

SK

Sasha Korovii in Natural Language Processing
украинского языка нет😔
источник

A

Andrei in Natural Language Processing
Cookie Thief
Лучше попробуйте взять мультияз USE вместо берта
а в каких случаях USE лучше чем берт?
источник

CT

Cookie Thief in Natural Language Processing
Andrei
а в каких случаях USE лучше чем берт?
Use изначально учился на задаче семантической близости, поэтому и эмбеддинги текстов у него более адекватные
источник

VR

Vladimir R in Natural Language Processing
Sebastian Pereira
Честно говоря исследовательский интерес в первую очередь. Хочу summary всех книг, которые ещё не прочёл)
Хорошо бы для начала сделать предметный указатель, потом относительно предметного указателя (набора терминов в нем) - извлечение определений, наиболее емкие утверждения и взаимосвязи с другими терминами в виде графа отношений...
источник

ЭЗ

Эмиль Зиляев... in Natural Language Processing
коллеги, хочу сделать ансамбль моделей под машинное чтение, как думаете какие модели помимо bert-base-multilingual-uncased стоит использовать?
источник

ЭЗ

Эмиль Зиляев... in Natural Language Processing
Думаю, будет хорошо, если принцип работы моделей будет разниться, чтобы разные модели ошибались в разных местах
источник

AZ

Alexandra Zh in Natural Language Processing
Всем привет, у меня есть небольшое задание, которое вряд ли займет больше нескольких часов, разумеется, за оплату. Есть шанс, что найду здесь исполнителя?
источник

AZ

Alexandra Zh in Natural Language Processing
Не знаю, насколько это в правилах чата, прошу не банить, если что)
источник

SS

Sergey Shulga in Natural Language Processing
С чем может быть связано, что при обучении модели на торче, каждый следующий батч на первой эпохе занимает времени больше чем предыдущий, но при этом со 2-3 эпохи в целом время выравнивается и становится сильно меньше?
источник

DD

David Dale in Natural Language Processing
Alexandra Zh
Всем привет, у меня есть небольшое задание, которое вряд ли займет больше нескольких часов, разумеется, за оплату. Есть шанс, что найду здесь исполнителя?
Насколько я знаю, размещать тут задания/проекты по теме NLP вполне нормально.
Предлагаю раскрыть суть задачи и возможную оплату)
источник

AZ

Alexandra Zh in Natural Language Processing
David Dale
Насколько я знаю, размещать тут задания/проекты по теме NLP вполне нормально.
Предлагаю раскрыть суть задачи и возможную оплату)
Отличные новости)
Предпочитаю в лс, чтобы не флудить, задача, если в целом — EDA по датасету, с уклоном на тональность.
источник