Телеграмм чат группы natural_language_processing страница 648

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1520 membersпожаловаться на группу

2020 April 27

SP

Sebastian Pereira in Natural Language Processing

Пробовал разные модели с трансформер архитектурой - ещё медленней.

источник

21:13пожаловаться #1

SP

Sebastian Pereira in Natural Language Processing

Пока думаю сформировать датасет с помощью большой SpaCy и попробовать обучить с ELMo embeddings классификатор, но может есть более простые пути?

источник

21:15пожаловаться #2

SP

Sebastian Pereira in Natural Language Processing

Язык - английский.

источник

21:15пожаловаться #3

A

Aleksandr in Natural Language Processing

А скармливать xml разметку можно или готовый текст?

источник

21:24пожаловаться #4

SP

Sebastian Pereira in Natural Language Processing

Готовый текст

источник

21:30пожаловаться #5

SP

Sebastian Pereira in Natural Language Processing

Причём текст у нас специфический, но SpaCy large справлялся хорошо

источник

21:31пожаловаться #6

SP

Sebastian Pereira in Natural Language Processing

Даты с ошибками, даты с сокращениями

источник

21:31пожаловаться #7

SP

Sebastian Pereira in Natural Language Processing

Но размер модели и скорость работы в Продакшн - оставляет желать лучшего.

источник

21:32пожаловаться #8

A

Aleksandr in Natural Language Processing

Вопрос - математика сильно нужна?

источник

21:32пожаловаться #9

SP

Sebastian Pereira in Natural Language Processing

Вопрос - математика сильно нужна?

В каком смысле?

источник

21:44пожаловаться #10

A

Aleksandr in Natural Language Processing

Sebastian Pereira

В каком смысле?

При написании кода

источник

21:45пожаловаться #11

A

Aleksandr in Natural Language Processing

матрицы всякие

источник

21:46пожаловаться #12

SP

Sebastian Pereira in Natural Language Processing

Нет, не думаю. В принципе я вижу несколько стандартных решений, которые можно попробовать, но может кто-то уже решал эту задачу.

источник

21:46пожаловаться #13

SP

Sebastian Pereira in Natural Language Processing

Самый простой, насколько я понимаю порезать модель от SpaCy оставив только нужное.

источник

21:46пожаловаться #14

A

Aleksandr in Natural Language Processing

Спасибо)

источник

21:49пожаловаться #15

SP

Sebastian Pereira in Natural Language Processing

Попробовали прунинг большой модели SpaCy - качество сильно упало

источник

23:43пожаловаться #16

2020 April 28

YB

Yuri Baburov in Natural Language Processing

Sebastian Pereira

Ищем даты и гео-таги.

Думаю, для дат можно уменьшить модель векторов (даже взять small), а для геотегов можно взять словарь Geo entities и добавить сравнение текущего слова со словарём в виде дополнительной фичи для модели tok2vec (так называется субмодель для word embeddings в spacy). Тогда опять же вектора можно будет уменьшить. Ну и там вектора ещё сами обычно с размерности 300 до размерности 96 уменьшаются, можно сразу снизить для задачи и перекомпилировать, хотя это скорости почти не добавит. Могу проконсультировать подробнее, пишите.

источник

00:31пожаловаться #17

RE

Ruslan Ermagambetov in Natural Language Processing

Ребята, привет
Задача суммаризации статей, может кто-то подсказать есть ли датасеты на русском и/или предобученные модели? Видел только датасет РИА-новостей, но там текст новости + заголовок к нему, немного не то.

источник

13:02пожаловаться #18

VM

Valentin Malykh in Natural Language Processing

а каких статей?

источник

13:04пожаловаться #19

FF

Futorio Franklin in Natural Language Processing

Ruslan Ermagambetov

Ребята, привет
Задача суммаризации статей, может кто-то подсказать есть ли датасеты на русском и/или предобученные модели? Видел только датасет РИА-новостей, но там текст новости + заголовок к нему, немного не то.

http://docs.deeppavlov.ai/en/master/apiref/models/bert.html#deeppavlov.models.bert.bert_as_summarizer.BertAsSummarizer есть от ДП самарайзер на берте

источник

13:05пожаловаться #20