Телеграмм чат группы natural_language_processing страница 720

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1711 membersпожаловаться на группу

2020 July 10

MT

Mikhail Tikhomirov in Natural Language Processing

Описания нет, но это новости за 2017 год, если мне не изменяет память. Да, нужно быть участником. Организаторы обещали убрать "аппрув" новых участников.

источник

15:47пожаловаться #1

FF

Futorio Franklin in Natural Language Processing

Можно добавить этот датасет в corus

источник

15:49пожаловаться #2

MT

Mikhail Tikhomirov in Natural Language Processing

Возможно вскоре появится наш RuNewsBERT в открытом доступе по этому датасету (просто с месяц дообучали на датасете RuBERT), он так то есть. и статья одного из студентов выйдет в этом году, где он ее использовал и получил прирост на саммаризации по сравнению с рубертом. Но пока еще не принято решение ее выложить.

источник

15:49пожаловаться #3

AK

Alexander Kukushkin in Natural Language Processing

Вроде нашел в https://github.com/dialogue-evaluation/taxonomy-enrichment

dialogue-evaluation/taxonomy-enrichment

Dialogue Evaluation 2020: Taxonomy Enrichment for the Russian Language - dialogue-evaluation/taxonomy-enrichment

источник

15:49пожаловаться #4

MT

Mikhail Tikhomirov in Natural Language Processing

Точно, ссылка на гитхабе есть

источник

15:50пожаловаться #5

FF

Futorio Franklin in Natural Language Processing

News corpus недоступен по ссылке

источник

15:50пожаловаться #6

MT

Mikhail Tikhomirov in Natural Language Processing

Хм, странно. Мб решили его убрать, хз.

источник

15:51пожаловаться #7

FF

Futorio Franklin in Natural Language Processing

Жаль

источник

15:51пожаловаться #8

MT

Mikhail Tikhomirov in Natural Language Processing

Я уточню у научника, открыт таки он или нет, раз был на соревновании.

источник

15:52пожаловаться #9

MT

Mikhail Tikhomirov in Natural Language Processing

Короче скорее всего он открытый да, просто на него нет нигде валидных ссылок. Выложу как нибудь на яндекс диск, данных много не бывает

источник

16:10пожаловаться #10

MT

Mikhail Tikhomirov in Natural Language Processing

Но так то я понимаю есть намного более крупные датасеты по новостям, кстати?

источник

16:16пожаловаться #11

AK

Alexander Kukushkin in Natural Language Processing

Mikhail Tikhomirov

Короче скорее всего он открытый да, просто на него нет нигде валидных ссылок. Выложу как нибудь на яндекс диск, данных много не бывает

Добавлю в https://github.com/natasha/corus . Есть вариант захостить на s3

natasha/corus

Links to Russian corpora, python functions for loading and parsing - natasha/corus

источник

16:17пожаловаться #12

AK

Alexander Kukushkin in Natural Language Processing

Mikhail Tikhomirov

Но так то я понимаю есть намного более крупные датасеты по новостям, кстати?

Мне не известно

источник

16:17пожаловаться #13

MT

Mikhail Tikhomirov in Natural Language Processing

О, ну тогда я подниму этот вопрос еще раз и как буду уверен что все ок, скину.
Хотя перед этим все же хотелось бы сделать его в нормальном формате, без разделения пунктуации и слов

источник

16:19пожаловаться #14

A

Alexander in Natural Language Processing

Всем привет! Подскажите, не могу сообразить, как мне переписать код чтобы использовать батчи? Наверняка же есть стандартная обертка. Памяти не хватает.
# Using BERT for the First TIme
# !pip install transformers
# model_class, tokenizer_class, pretrained_weights = (ppb.DistilBertModel, ppb.DistilBertTokenizer, 'distilbert-base-uncased')
# model = model_class.from_pretrained(pretrained_weights)
with torch.no_grad():
last_hidden_states = model(input_ids, attention_mask=attention_mask)

источник

17:00пожаловаться #15

MF

M F in Natural Language Processing

Всем привет! Подскажите, не могу сообразить, как мне переписать код чтобы использовать батчи? Наверняка же есть стандартная обертка. Памяти не хватает.
# Using BERT for the First TIme
# !pip install transformers
# model_class, tokenizer_class, pretrained_weights = (ppb.DistilBertModel, ppb.DistilBertTokenizer, 'distilbert-base-uncased')
# model = model_class.from_pretrained(pretrained_weights)
with torch.no_grad():
last_hidden_states = model(input_ids, attention_mask=attention_mask)

torch.utils.data.DataLoader

источник

17:03пожаловаться #16

A

Alexander in Natural Language Processing

вот и не могу примера найти как его для эмбедингов предложений Bert использовать

источник

17:20пожаловаться #17

A

Alexander in Natural Language Processing

и сообразить тоже не получается 😞

источник

17:21пожаловаться #18

OR

Oleg Ruban in Natural Language Processing

вот и не могу примера найти как его для эмбедингов предложений Bert использовать

Берт сам эмбеддинги создает, дополнительно не надо вроде

источник

17:43пожаловаться #19

AK

Anton K. in Natural Language Processing

друзья, есть ли готовые решения для разметки текста на фотографии? у меня есть изображения и координаты найденных кусочков текста. хочу дать возможность пользователям выбирать область и вписывать туда текст, который в этой области

источник

17:46пожаловаться #20