Size: a a a

Natural Language Processing

2021 March 12

N

Natalia in Natural Language Processing
Andrei
клёво!

и ксати вроде spacy тоже умеет выделять подобные чанки
источник

N

Natalia in Natural Language Processing
может, но надо допилить немножко
источник

SK

Sasha Korovii in Natural Language Processing
Такой вопрос, а не подскажете как под капотом работает fasttext supervised_learning хотел би узнать для себе, если можна скинуть пару ссилок? И возможно ли сделать такую же модель например на PyTorch?
источник
2021 March 14

AS

Artem Storm in Natural Language Processing
Кто-нибудь знает как нормируется расстояние Левенштейна между двумя строками (в postgreSQL) чтобы близость от 0 до 1 выдавать? на длину бОльшей строки?
источник

SL

Shelest Listjev in Natural Language Processing
Всем привет!
Кто-нибудь, может, сталкивался со следующей проблемой в spacy во время дебага данных с конфигом с моделью "bert-base-multilingual-uncased" (потому что с tok2vec такой проблемы не возникает):

ValueError: [E093] token.ent_iob values make invalid sequence: I without B
50|O тыс|O .|O фунтов|O

Проблема в том, что у токенов, на которых выдает ошибку, нету тага "I" в принципе...
источник

MK

Max Kuznetsov in Natural Language Processing
Sasha Korovii
Такой вопрос, а не подскажете как под капотом работает fasttext supervised_learning хотел би узнать для себе, если можна скинуть пару ссилок? И возможно ли сделать такую же модель например на PyTorch?
источник

Н

Настя Обрезкова... in Natural Language Processing
Привет!
Подскажите, а кто-то строил ансамблевые модели над синтаксическими парсерами?
источник

SP

Sebastian Pereira in Natural Language Processing
Настя Обрезкова
Привет!
Подскажите, а кто-то строил ансамблевые модели над синтаксическими парсерами?
Настя, какая задача? Ансамблевые модели - это посто последовательность моделей которые следуют логике, что вы подразумеваете под синтаксическим  парсером? Мы решали похожие задачи для клиентов.
источник

SP

Sebastian Pereira in Natural Language Processing
По моему SpaCy match использовали чтобы находить определенные конструкции и потом поверх них тренировали модели для авторазметки.
источник

Н

Настя Обрезкова... in Natural Language Processing
Sebastian Pereira
Настя, какая задача? Ансамблевые модели - это посто последовательность моделей которые следуют логике, что вы подразумеваете под синтаксическим  парсером? Мы решали похожие задачи для клиентов.
Я изучала синтаксические анализаторы (spacy, slovnet, deeppavlov) для 1 входного предложения на русском языке.
Нужно построить смешанный ансамбль, объединить модели и добиться лучшей точности, чем у каждой модели в отдельности.
Это задание ВКР
источник

AK

Alexander Kukushkin in Natural Language Processing
Семинар @cointegrated про программирование ботов для Алисы, и вообще хороший канал про NLP и чатботов
источник

AK

Alexander Kukushkin in Natural Language Processing
Наверное, стоит сюда закинуть мой недавний двухчасовой вебинар по разработке навыков Алисы в Python
https://youtu.be/VlkCJ26Gd60
источник

Е

Егорка in Natural Language Processing
Настя Обрезкова
Я изучала синтаксические анализаторы (spacy, slovnet, deeppavlov) для 1 входного предложения на русском языке.
Нужно построить смешанный ансамбль, объединить модели и добиться лучшей точности, чем у каждой модели в отдельности.
Это задание ВКР
Я бы сначала определился с исходными данными. Потом получил показатели метрик эффективности для каждой модели на выбранном датасете. А после принимал решение об ансамбле. Может оказаться, что одна из моделей плохо справляется с задачей и ее не надо учитывать. Может только одна из моделей показывает удовлетворительный результат.
источник

N

Natalia in Natural Language Processing
можно вообще на типы ошибок посмотреть для начала
источник

А

Алмаз in Natural Language Processing
Все привет ребят,

"""Load IMDB dataset, tokenize texts, and display its representation for each word"""

Появилось такое задание никак не могу понять что надо сделать
в IMDB датасете, просто 50к текстов
источник

А

Алмаз in Natural Language Processing
Кто может хотябы направить
источник

А

Алмаз in Natural Language Processing
Что надо найти
источник

A

Anton in Natural Language Processing
Алмаз
Кто может хотябы направить
Сделать токенизацию текстов, и вывести на экран несколько слов.
источник

А

Алмаз in Natural Language Processing
И все получается? Просто вывести?)
источник

Е

Егорка in Natural Language Processing
Здесь не написано отображать их в какое-то векторное пространство
источник