Телеграмм чат группы natural_language_processing страница 1578

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

3244 membersпожаловаться на группу

2021 December 21

IG

Ilya Gusev in Natural Language Processing

https://habr.com/ru/post/596481/
Всем привет!
Я выпустил третью часть цикла статей про суммаризацию.
На этот раз про абстрактивные методы, в том числе про известные трансформерные модели: GPT, BART, T5.

источник

10:35пожаловаться #1

A

Anton in Natural Language Processing

Подскажите, пожалуйста, что сейчас sota для создания эмбеддингов русского текста на юридическом домене (законы, бухгалтерия, кадры)?
Задача - найти ближайших к источнику (заголовок, аннотация, ключевые слова, текст - всё есть и создано человеком)

источник

11:24пожаловаться #2

БЧ

Бакытжан Четтикбаев... in Natural Language Processing

интересная статья 👍

источник

11:27пожаловаться #3

IG

Ilya Gusev in Natural Language Processing

Как будто бы для юридических текстов должно работать примерно всё то же самое: LaBSE из коробки, дообучение fasttext'а. Более того, я в жизни видел fasttext классификатор приговоров суда.

источник

11:31пожаловаться #4

A

Anton in Natural Language Processing

👍🏻точно, попробую фасттекст дообучить.
Сейчас USE тестирую. В целом неплохо, только не получается им задать бОльший вес для ключевых слов.

источник

11:34пожаловаться #5

NK

Nikolay Karelin in Natural Language Processing

Если совсем уже ключевые слова нужны - то может лучше старый добрый TF-IDF, а не эмбеддинги? Там и веса можно подкручивать.

источник

11:48пожаловаться #6

FF

Futorio Franklin in Natural Language Processing

Можно взвешивать эмбеддинги слов с помощью tf-idf

источник

11:49пожаловаться #7

A

Anton in Natural Language Processing

Неа, он не летит. Контекст не захватывает, а он очень важен. (временами)

источник

11:49пожаловаться #8

FF

Futorio Franklin in Natural Language Processing

Для компромиса

источник

11:49пожаловаться #9

A

Anton in Natural Language Processing

Попробую методику от keybert наверное, там есть реализация двух алгоритмов из коробки.

источник

11:50пожаловаться #10

NK

Nikolay Karelin in Natural Language Processing

Тогда пробовать комбинировать

источник

11:50пожаловаться #11

A

Anton in Natural Language Processing

Сходу не догоняю как это сделать.

источник

11:50пожаловаться #12

IG

Ilya Gusev in Natural Language Processing

Просто домножать на tfidf во время усреднения

источник

11:55пожаловаться #13

КМ

Константин Маркион... in Natural Language Processing

Коллеги, подскажите, я верно понял, что у Yargy нет подробного описания документации? Чтобы было перечисление, что interpretation() - это то-то, а is_capitalized() - это то-то?

источник

14:42пожаловаться #14

КМ

Константин Маркион... in Natural Language Processing

Сколько не искал, везде только примеры.

источник

14:42пожаловаться #15

VF

Vadim Fomin in Natural Language Processing

источник

14:45пожаловаться #16

B

Banof in Natural Language Processing

🔫 @Hansklaus12 кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@wadimiusz, @markyon, @kamane_margane, @nekrasov_anton, @ohnekit, @IvanMalakhovVl
При поддержке Золота Бородача

источник

14:46пожаловаться #17

MB

Mark Baushenko in Natural Language Processing

Всем привет, новенький в нлп. Есть задача по слову или словосочетанию понять что это(человек, фио, место и тд). Необязательно такие сущности, но какой то разбор хотелось бы. В какую сторону нужно думать и какие методы есть для этого? Заранее спасибо!

источник

14:46пожаловаться #18

FF

Futorio Franklin in Natural Language Processing

Звучит как задача NER

источник

14:48пожаловаться #19

Б

Борис in Natural Language Processing

Добрый день. Есть задача собирать статьи, комменты и тд с разных ресурсов, затем анализировать. Вопрос как лучше их хранить и обрабатывать? Можно на диске в txt формате складывать грубо говоря. Но может есть какие то фреимворки, заточенные под это базы данных или инструменты, практики, подходы? Сейчас пока объём маленький, складываю на диск.

источник

15:01пожаловаться #20