Телеграмм чат группы natural_language_processing страница 822

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2023 membersпожаловаться на группу

2020 September 06

DP

Defragmented Panda in Natural Language Processing

Подскажите каким путём пойти: хочу чтобы нейросетка отвечала на несложные вопросы, но только заранее подготовленными цитатами(к примеру из тройки больших книг). Другое запрещено.
Может готовое видели что-то?

1) ручное разбивание книг на цитаты, классификация на примерах на какой вопрос какой цитатой отвечать. это простой путь но требует много времени на разметку.

2) перетренировать имеющуюся модель языка (gpt2, bert) так, чтобы при ответе она получала больше бонуса если ее ответ имеет близкое совпадение с книгой. но все еще высок шанс что сеть тупо выберет 1 цитату и будет ее пихать везде. для защиты от этого придется делать и обратный процесс - давая цитату из книги которую выбрала первая сеть угадать (на высоком уровне) содержание вопроса который был задан. Это очень сложный путь.

источник

19:10пожаловаться #1

A

Ali in Natural Language Processing

Всем привет! Я хочу развиться в NLP, реализовать кое-какие свои проекты. В активе - пара курсов по Python, есть склонность к математике и языкам. Можете посоветовать какие-то курсы, чтобы максимально быстро достичь уровня среднего участника этого чата?

источник

20:08пожаловаться #2

DO

Diana Onufrienko in Natural Language Processing

Roman Inflianskas

Я рассчитывал, что если есть многоязычный Wiktionary, то должен быть и нормальный многоязычный словарь, который без особых проблем можно дёргать из Python (то есть без парсинга Викисловаря).
И если бы не баг в dbnary, то мне бы и хватило wikdict.
Понятно, что если каждую языковую пару делать отдельно, то можно более хороших результатов достичь. Но это мой проект в свободное нерабочее время, хочется как-то попроще сделать, чтобы вообще доделать;)

Может, пригодится параллельный корпус? Точно есть материалы на финском и python tools :) http://opus.nlpl.eu/

источник

20:11пожаловаться #3

RI

Roman Inflianskas in Natural Language Processing

Diana Onufrienko

Может, пригодится параллельный корпус? Точно есть материалы на финском и python tools :) http://opus.nlpl.eu/

Спасибо за ссылку! Да, я собирался этот ресурс использовать (open subtitles, Tatoeba). Но перед тем, как выдавать фразы, было бы хорошо выдавать отдельные слова для изучения, а в этом ресурсе словаря вроде бы нет.

источник

20:16пожаловаться #4

DO

Diana Onufrienko in Natural Language Processing

Roman Inflianskas

Спасибо за ссылку! Да, я собирался этот ресурс использовать (open subtitles, Tatoeba). Но перед тем, как выдавать фразы, было бы хорошо выдавать отдельные слова для изучения, а в этом ресурсе словаря вроде бы нет.

А если вот такую штуку для word translation попробовать: https://github.com/facebookresearch/MUSE? (только учусь, так что не знаю, насколько это дельный совет, good luck ✨)

facebookresearch/MUSE

A library for Multilingual Unsupervised or Supervised word Embeddings - facebookresearch/MUSE

источник

20:28пожаловаться #5

RI

Roman Inflianskas in Natural Language Processing

Diana Onufrienko

А если вот такую штуку для word translation попробовать: https://github.com/facebookresearch/MUSE? (только учусь, так что не знаю, насколько это дельный совет, good luck ✨)

facebookresearch/MUSE

A library for Multilingual Unsupervised or Supervised word Embeddings - facebookresearch/MUSE

Спасибо! Правда в этой штуке (если я правильно понял) нет sense-ов, поэтому не уверен, что получится приспособить.

источник

20:46пожаловаться #6

NS

Nikolay V. Shmyrev in Natural Language Processing

Ali

Всем привет! Я хочу развиться в NLP, реализовать кое-какие свои проекты. В активе - пара курсов по Python, есть склонность к математике и языкам. Можете посоветовать какие-то курсы, чтобы максимально быстро достичь уровня среднего участника этого чата?

Курсов сами по себе без практики пользы много не приносят, надо с проектов начинать. Можно в каком-нибудь проекте с открытым кодом поучастовать.

источник

20:48пожаловаться #7

SP

Sebastian Pereira in Natural Language Processing

Коллеги, кто-то longformer на русском пробовал обучать? Какой токинайзер брали?

источник

20:52пожаловаться #8

V

Vanya in Natural Language Processing

Nikolay V. Shmyrev

Курсов сами по себе без практики пользы много не приносят, надо с проектов начинать. Можно в каком-нибудь проекте с открытым кодом поучастовать.

Не согласен, что нужно начинать с проектов. В лучшем случае будет ничего не понятно

источник

20:53пожаловаться #9

V

Vanya in Natural Language Processing

Ali

Всем привет! Я хочу развиться в NLP, реализовать кое-какие свои проекты. В активе - пара курсов по Python, есть склонность к математике и языкам. Можете посоветовать какие-то курсы, чтобы максимально быстро достичь уровня среднего участника этого чата?

Бери любую книгу по nlp и читай

источник

20:54пожаловаться #10

V

Vanya in Natural Language Processing

Можешь посмотреть записи лекций по грамматикам и машинному обучению из топовых вузов

источник

20:56пожаловаться #11

A

Ali in Natural Language Processing

Nikolay V. Shmyrev

Курсов сами по себе без практики пользы много не приносят, надо с проектов начинать. Можно в каком-нибудь проекте с открытым кодом поучастовать.

Спасибо, Николай! А можете сориентировать где можно такие проекты искать? В частности что-то хоть отдаленно похожее на мою задачу - генерацию constrained writing текстов на родном языке?

источник

20:56пожаловаться #12

A

Ali in Natural Language Processing

Можешь посмотреть записи лекций по грамматикам и машинному обучению из топовых вузов

Спасибо, Иван! Да, думаю ВШЭ и/или МФТИ мне подойдёт

источник

20:57пожаловаться #13

V

Vanya in Natural Language Processing

Ali

Спасибо, Иван! Да, думаю ВШЭ и/или МФТИ мне подойдёт

Мне лекции Сорокина из МФТИ понравились (по формальным грамматикам)

источник

20:59пожаловаться #14

NS

Nikolay V. Shmyrev in Natural Language Processing

Ali

Спасибо, Николай! А можете сориентировать где можно такие проекты искать? В частности что-то хоть отдаленно похожее на мою задачу - генерацию constrained writing текстов на родном языке?

https://github.com/huggingface/transformers/issues/6045 надо протестировать использование памяти в bart

Test BART's memory consumption · Issue #6045 · huggingface/transformers

this can run on GPU only and be marked @slow check how much memory bart is using at __init__ assert that it doesn't use more than 110% of that. check how much memory bart uses on a single f...

источник

21:00пожаловаться #15

NS

Nikolay V. Shmyrev in Natural Language Processing

help wanted стоит

источник

21:01пожаловаться #16

АА

Алксан Аресир... in Natural Language Processing

Привет.
Есть джавовые бибилиотеки для работы со словами языка? например деление на морфемы
И прикол в том что надо ещё возможность задать свой язык и обучить систему своими данными

источник

21:02пожаловаться #17

NS

Nikolay V. Shmyrev in Natural Language Processing

Nikolay V. Shmyrev

https://github.com/huggingface/transformers/issues/6045 надо протестировать использование памяти в bart

Test BART's memory consumption · Issue #6045 · huggingface/transformers

this can run on GPU only and be marked @slow check how much memory bart is using at __init__ assert that it doesn't use more than 110% of that. check how much memory bart uses on a single f...

https://github.com/minimaxir/textgenrnn можно ещё посмотреть, но там автор загрустил что-то

minimaxir/textgenrnn

Easily train your own text-generating neural network of any size and complexity on any text dataset with a few lines of code. - minimaxir/textgenrnn

источник

21:07пожаловаться #18

2020 September 07

DZ

Dmitrii Zhurman in Natural Language Processing

Привет.
Не могли бы вы, пожалуйста, подсказать, какие есть библиотеки помимо Natasha, dateparser и rutimeparser для извлечения и, самое главное, нормализации временных конструкций?

источник

09:23пожаловаться #19

KS

Konstantin Smith in Natural Language Processing

Dmitrii Zhurman

Привет.
Не могли бы вы, пожалуйста, подсказать, какие есть библиотеки помимо Natasha, dateparser и rutimeparser для извлечения и, самое главное, нормализации временных конструкций?

Pullenti

источник

09:50пожаловаться #20