Телеграмм чат группы natural_language

2021 March 12

N

клёво!

и ксати вроде spacy тоже умеет выделять подобные чанки

https://t.me/natural_language_processing/25088

Yuri Baburov in Natural Language Processing

Встречаем русские модели в официальном каталоге Spacy !
Мы плыли, плыли, и наконец приплыли:
https://nightly.spacy.io/models/ru
( вошло в https://github.com/explosion/spaCy/releases/tag/v3.0.0rc3 )
Модели там только для spacy 3.0 , а для версии 2.3 модели у меня: https://github.com/buriy/spacy-ru
огромное спасибо Саше @alexkuk за подготовку релиза и датасетов и немного спасибо мне. И конечно спасибо контрибуторам в spacy-ru , что помогли нам проложить дорогу к светлому будущему. Ещё не всё вошло в этот релиз, только самое основное. Будем улучшать в частности лемматизацию и выделение noun_chunks, а потом и токенизацию. И релиз с трансформерами сделаем.

источник

14:10пожаловаться #1

N

Natalia in Natural Language Processing

может, но надо допилить немножко

источник

14:10пожаловаться #2

SK

Sasha Korovii in Natural Language Processing

Такой вопрос, а не подскажете как под капотом работает fasttext supervised_learning хотел би узнать для себе, если можна скинуть пару ссилок? И возможно ли сделать такую же модель например на PyTorch?

источник

21:27пожаловаться #3

2021 March 14

AS

Artem Storm in Natural Language Processing

Кто-нибудь знает как нормируется расстояние Левенштейна между двумя строками (в postgreSQL) чтобы близость от 0 до 1 выдавать? на длину бОльшей строки?

источник

11:50пожаловаться #4

SL

Shelest Listjev in Natural Language Processing

Всем привет!
Кто-нибудь, может, сталкивался со следующей проблемой в spacy во время дебага данных с конфигом с моделью "bert-base-multilingual-uncased" (потому что с tok2vec такой проблемы не возникает):

ValueError: [E093] token.ent_iob values make invalid sequence: I without B
50|O тыс|O .|O фунтов|O

Проблема в том, что у токенов, на которых выдает ошибку, нету тага "I" в принципе...

источник

13:13пожаловаться #5

MK

Max Kuznetsov in Natural Language Processing

Sasha Korovii

Такой вопрос, а не подскажете как под капотом работает fasttext supervised_learning хотел би узнать для себе, если можна скинуть пару ссилок? И возможно ли сделать такую же модель например на PyTorch?

https://arxiv.org/abs/1607.01759

источник

14:22пожаловаться #6

Н

Настя Обрезкова... in Natural Language Processing

Привет!
Подскажите, а кто-то строил ансамблевые модели над синтаксическими парсерами?

источник

17:14пожаловаться #7

SP

Sebastian Pereira in Natural Language Processing

Настя Обрезкова

Привет!
Подскажите, а кто-то строил ансамблевые модели над синтаксическими парсерами?

Настя, какая задача? Ансамблевые модели - это посто последовательность моделей которые следуют логике, что вы подразумеваете под синтаксическим парсером? Мы решали похожие задачи для клиентов.

источник

17:19пожаловаться #8

SP

Sebastian Pereira in Natural Language Processing

По моему SpaCy match использовали чтобы находить определенные конструкции и потом поверх них тренировали модели для авторазметки.

источник

17:20пожаловаться #9

Н

Настя Обрезкова... in Natural Language Processing

Sebastian Pereira

Настя, какая задача? Ансамблевые модели - это посто последовательность моделей которые следуют логике, что вы подразумеваете под синтаксическим парсером? Мы решали похожие задачи для клиентов.

Я изучала синтаксические анализаторы (spacy, slovnet, deeppavlov) для 1 входного предложения на русском языке.
Нужно построить смешанный ансамбль, объединить модели и добиться лучшей точности, чем у каждой модели в отдельности.
Это задание ВКР

источник

17:22пожаловаться #10

AK

Alexander Kukushkin in Natural Language Processing

Семинар @cointegrated про программирование ботов для Алисы, и вообще хороший канал про NLP и чатботов

источник

17:32пожаловаться #11

AK

Alexander Kukushkin in Natural Language Processing

Наверное, стоит сюда закинуть мой недавний двухчасовой вебинар по разработке навыков Алисы в Python
https://youtu.be/VlkCJ26Gd60

YouTube

Мастер-класс по разработке навыков Алисы в Python

Занятие провёл Давид Дале (https://daviddale.ru). Если вы хотите поблагодарить спикера, можете сделать донат удобным вам способом на https://sobe.ru/na/alic...

источник

17:32пожаловаться #12

Е

Егорка in Natural Language Processing

Настя Обрезкова

Я изучала синтаксические анализаторы (spacy, slovnet, deeppavlov) для 1 входного предложения на русском языке.
Нужно построить смешанный ансамбль, объединить модели и добиться лучшей точности, чем у каждой модели в отдельности.
Это задание ВКР

Я бы сначала определился с исходными данными. Потом получил показатели метрик эффективности для каждой модели на выбранном датасете. А после принимал решение об ансамбле. Может оказаться, что одна из моделей плохо справляется с задачей и ее не надо учитывать. Может только одна из моделей показывает удовлетворительный результат.

источник

18:12пожаловаться #13

N

Natalia in Natural Language Processing

можно вообще на типы ошибок посмотреть для начала

источник

18:14пожаловаться #14

А

Алмаз in Natural Language Processing

Все привет ребят,

"""Load IMDB dataset, tokenize texts, and display its representation for each word"""

Появилось такое задание никак не могу понять что надо сделать
в IMDB датасете, просто 50к текстов

источник

18:31пожаловаться #15

А

Алмаз in Natural Language Processing

Кто может хотябы направить

источник

18:31пожаловаться #16

А

Алмаз in Natural Language Processing

Что надо найти

источник

18:32пожаловаться #17