Size: a a a

Natural Language Processing

2021 October 14

AN

Aydar Nasyrov in Natural Language Processing
Для тестов использовал pipeline от HuggingFace, применял разные методы объединения токенов (simple, first, average, max), но ни один не дал желаемого результата.
источник

DD

David Dale in Natural Language Processing
Использовать вместо pipeline голые tokenizer и model, и написать собственный код для агрегации результатов.
источник

AM

Alex Mak in Natural Language Processing
А сберовская roberta тоже так может? ;)
источник

DD

David Dale in Natural Language Processing
Не знаю, пока не пробовал её. Но судя по Russiansupeeglue, она весьма годная.
А вообще так-то и диппавловский BERT тоже нормально заводится.
источник

N

Naz in Natural Language Processing
ребята, такой вопрос. У меня есть 15 категорий в трудовой области, где перечисленны в виде пар слов, обязанности, что человек должнен выполнить. Например, сфера ИТ, навыки [работа команда:34,чистый код:49…] там частота появления. Я хочу как то это визуализировать правильно, но не знаю как. Может типа graph, просто бар с счётом не хочется, слишком много и примитивно. Может есть у кого опыт? В каждый категории сотни навыков.
источник

IK

Ilya Kalinin in Natural Language Processing
Радиально-полосчатая?.. https://habrahabr.ru/post/345204/
источник

IK

Ilya Kalinin in Natural Language Processing
Ну или "роза ветров", по классификации статьи...
источник

ТЕ

Таёжный Ежи... in Natural Language Processing
Облако тегов?
источник

N

Naz in Natural Language Processing
слишком много элементов в категории
источник

ТЕ

Таёжный Ежи... in Natural Language Processing
Нужно отобразить сотни элементов, чтобы было понятно?
источник

ТЕ

Таёжный Ежи... in Natural Language Processing
Придётся элементы отображать без подписей. Т. е. на картинке не будет слов «работа команда» и «чистый код».
источник

ТЕ

Таёжный Ежи... in Natural Language Processing
Вообще, нужно более подробное ТЗ.
источник

AM

Alex Mak in Natural Language Processing
Да, диппавловский я попробовал, но там что-то с 10-ти примеров не самое идеальное качество, хотя и неплохое. Поэтому и спросил.
источник

ТЕ

Таёжный Ежи... in Natural Language Processing
Непопулярные не отображать или отображать чёрточками.
источник

A*

Arman * in Natural Language Processing
народ какой либой можно быстрее всего рассчитывать расстояние Левенштейна?
источник

A*

Arman * in Natural Language Processing
сам написал но она медленная
источник

ТЕ

Таёжный Ежи... in Natural Language Processing
python-Levenshtein
источник

E

Edward in Natural Language Processing
Pullentity пробовали привлекать?
источник

B

Banof in Natural Language Processing
🔫 @MariiaTouzakova кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@wadimiusz, @WinteryFox, @viviby, Dmitrii Tatarnikov, @steysie
При поддержке Золота Бородача
источник

EI

Evgeniy Ivanov in Natural Language Processing
Нет, что это ?)
источник