Size: a a a

Natural Language Processing

2019 November 08

AE

Anton Eryomin in Natural Language Processing
нечто подобное, кстати, я уже делаю. Визуально вроде бы неплохо работает )
источник

m

mel kaye in Natural Language Processing
есть какой то разбор иерархии хомского для чайников?
источник
2019 November 10

AZ

Andrey Zakharov in Natural Language Processing
ребят, возможно уже задавали вопрос, но вдруг - как у Наташи из location extractor достать найденную локацию в той форме, какой она была в тексте?
источник

AZ

Andrey Zakharov in Natural Language Processing
Andrey Zakharov
ребят, возможно уже задавали вопрос, но вдруг - как у Наташи из location extractor достать найденную локацию в той форме, какой она была в тексте?
нашел, span
источник
2019 November 11

H

Hemant in Natural Language Processing
Is there a telegram NLP channel for people who speak English?
источник

V

Victoria in Natural Language Processing
You can ask your questions in English here
источник

B

Banof in Natural Language Processing
🔫 @praveen_techmanager кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@yuri_baburov, @bougay, @v696973, @karpishin, Brenoritvrezorkre
источник
2019 November 12

H

Hemant in Natural Language Processing
Okay.
источник

H

Hemant in Natural Language Processing
Could you suggest projects for NLP in the field of big data
источник

АЗ

Андрей Заспа in Natural Language Processing
Ребят, подскажите а как делать иерархическую классификацию? Когда общее кол-во классов велико, но кол-во подкатегорий для каждой категории не велико? делать отельные модели для каждой категории?
источник

t2

tonko 22 in Natural Language Processing
Андрей Заспа
Ребят, подскажите а как делать иерархическую классификацию? Когда общее кол-во классов велико, но кол-во подкатегорий для каждой категории не велико? делать отельные модели для каждой категории?
Есть алгоритмы которые сразу обе задачи решают, HDBSCAN, например
источник

D(

David (ddale) Dale in Natural Language Processing
tonko 22
Есть алгоритмы которые сразу обе задачи решают, HDBSCAN, например
сказано же, классификацию, а кластеризацию)
источник

D(

David (ddale) Dale in Natural Language Processing
Андрей Заспа
Ребят, подскажите а как делать иерархическую классификацию? Когда общее кол-во классов велико, но кол-во подкатегорий для каждой категории не велико? делать отельные модели для каждой категории?
Зависит от того, какую метрику ты хочешь оптимизировать.
Если любая ошибка классификации для тебя одинаково плоха (вне зависимости от того, верно ли ты угадал категорию верхнего уровня), то классификатор, учитывающий иерархическую структуру классов, вряд ли будет лучше обычного, не-иерархического.
А если тебе важно угадать хотя бы верхнеуровневую категорию, то да, можно сделать два уровня: одна модель предсказывает категорию, а другая (по модели на категорию) - подкатегорию.
источник

A

Aragaer in Natural Language Processing
более того, в каждой подкатегории можно натренить отдельную модель
источник

АЗ

Андрей Заспа in Natural Language Processing
Понял спасибо, правда когда дерево иерархий глубины 4, т.е. у каждого отзыва клиента 3 поля описывающих его заявку, то столько моделей проблемно делать
источник

D(

David (ddale) Dale in Natural Language Processing
Андрей Заспа
Понял спасибо, правда когда дерево иерархий глубины 4, т.е. у каждого отзыва клиента 3 поля описывающих его заявку, то столько моделей проблемно делать
Ну на самом деле это может быть не 100500 моделей, а одна, в которую категория, с которой мы в данный момент хотим работать, подаётся как фича.
источник

АЗ

Андрей Заспа in Natural Language Processing
но так как подгатегории зависят от основной категории, то нельзя исключить, что модель выдаст несущесвующую для данной категории подгатегорию
источник

В

Владислав in Natural Language Processing
Здравствуйте. Загрузил предобучную русскоязычную BERT модель. Всё делаю строго по инструкции, на моменте load_trained_model_from_checkpoint вылетает питон. Стоит win10x64, tf 2.0.0. Пробовал также на 1.14, тоже вылетает. Кто знает, в чем может быть проблема?
источник

PL

Pavel Lebedev in Natural Language Processing
Привет! Дано: большое количество предобработанных текстов в таком виде: 1) «мотивы» (атомарные составляющие текстов) 2) «традиции» (условно, язык, страна, или место, где записывались мотивы; каждая традиция состоит из множества мотивов; имеет также географические координаты) 3) разреженная матрица традиции/мотивы: какие мотивы в каких традициях встречаются. 4) отдельные мотивы малозначимы и могут являться шумами, но статистически значимые совпадения многих мотивов в разных традициях могут показывать их, в некотором смысле, «родство». Известно, что разные традиции имеют разную степень «родства» и включают разные «комбинации» других традиций, плюс какое-то количество своих уникальных мотивов. В разных крупномасштабных регионах преобладают разные группы мотивов. Требуется: Что бы такого наглядного из этой матрицы можно было бы кластеризовать/классифицировать/регрессировать/еще как-то выделить? Как можно попытаться выделить крупномасштабные структуры? Что можно было бы попробовать отобразить на карте? Какими алгоритмами?
источник

B

Brenoritvrezorkre in Natural Language Processing
Андрей Заспа
Ребят, подскажите а как делать иерархическую классификацию? Когда общее кол-во классов велико, но кол-во подкатегорий для каждой категории не велико? делать отельные модели для каждой категории?
По теме иерархий сразу вспоминается formal concept analysis, но это просто воспоминание.
источник