Size: a a a

Natural Language Processing

2020 September 06

DP

Defragmented Panda in Natural Language Processing
berkut x
Подскажите каким путём пойти: хочу чтобы нейросетка отвечала на несложные вопросы, но только заранее подготовленными цитатами(к примеру из тройки больших книг). Другое запрещено.
Может готовое видели что-то?
1) ручное разбивание книг на цитаты, классификация на примерах на какой вопрос какой цитатой отвечать. это простой путь но требует много времени на разметку.

2) перетренировать имеющуюся модель языка (gpt2, bert) так, чтобы при ответе она получала больше бонуса если ее ответ имеет близкое совпадение с книгой. но все еще высок шанс что сеть тупо выберет 1 цитату и будет ее пихать везде. для защиты от этого придется делать и обратный процесс - давая цитату из книги которую выбрала первая сеть угадать (на высоком уровне) содержание вопроса который был задан. Это очень сложный путь.
источник

A

Ali in Natural Language Processing
Всем привет! Я хочу развиться в NLP, реализовать кое-какие свои проекты. В активе - пара курсов по Python, есть склонность к математике и языкам. Можете посоветовать какие-то курсы, чтобы максимально быстро достичь уровня среднего участника этого чата?
источник

DO

Diana Onufrienko in Natural Language Processing
Roman Inflianskas
Я рассчитывал, что если есть многоязычный Wiktionary, то должен быть и нормальный многоязычный словарь, который без особых проблем можно дёргать из Python (то есть без парсинга Викисловаря).
И если бы не баг в dbnary, то мне бы и хватило wikdict.
Понятно, что если каждую языковую пару делать отдельно, то можно более хороших результатов достичь. Но это мой проект в свободное нерабочее время, хочется как-то попроще сделать, чтобы вообще доделать;)
Может, пригодится параллельный корпус? Точно есть материалы на финском и python tools :) http://opus.nlpl.eu/
источник

RI

Roman Inflianskas in Natural Language Processing
Diana Onufrienko
Может, пригодится параллельный корпус? Точно есть материалы на финском и python tools :) http://opus.nlpl.eu/
Спасибо за ссылку! Да, я собирался этот ресурс использовать (open subtitles, Tatoeba). Но перед тем, как выдавать фразы, было бы хорошо выдавать отдельные слова для изучения, а в этом ресурсе словаря вроде бы нет.
источник

DO

Diana Onufrienko in Natural Language Processing
Roman Inflianskas
Спасибо за ссылку! Да, я собирался этот ресурс использовать (open subtitles, Tatoeba). Но перед тем, как выдавать фразы, было бы хорошо выдавать отдельные слова для изучения, а в этом ресурсе словаря вроде бы нет.
А если вот такую штуку для word translation попробовать: https://github.com/facebookresearch/MUSE? (только учусь, так что не знаю, насколько это дельный совет, good luck ✨)
источник

RI

Roman Inflianskas in Natural Language Processing
Diana Onufrienko
А если вот такую штуку для word translation попробовать: https://github.com/facebookresearch/MUSE? (только учусь, так что не знаю, насколько это дельный совет, good luck ✨)
Спасибо! Правда в этой штуке (если я правильно понял) нет sense-ов, поэтому не уверен, что получится приспособить.
источник

NS

Nikolay V. Shmyrev in Natural Language Processing
Ali
Всем привет! Я хочу развиться в NLP, реализовать кое-какие свои проекты. В активе - пара курсов по Python, есть склонность к математике и языкам. Можете посоветовать какие-то курсы, чтобы максимально быстро достичь уровня среднего участника этого чата?
Курсов сами по себе без практики пользы много не приносят, надо с проектов начинать. Можно в каком-нибудь проекте с открытым кодом поучастовать.
источник

SP

Sebastian Pereira in Natural Language Processing
Коллеги, кто-то longformer на русском пробовал обучать? Какой токинайзер брали?
источник

V

Vanya in Natural Language Processing
Nikolay V. Shmyrev
Курсов сами по себе без практики пользы много не приносят, надо с проектов начинать. Можно в каком-нибудь проекте с открытым кодом поучастовать.
Не согласен, что нужно начинать с проектов. В лучшем случае будет ничего не понятно
источник

V

Vanya in Natural Language Processing
Ali
Всем привет! Я хочу развиться в NLP, реализовать кое-какие свои проекты. В активе - пара курсов по Python, есть склонность к математике и языкам. Можете посоветовать какие-то курсы, чтобы максимально быстро достичь уровня среднего участника этого чата?
Бери любую книгу по nlp и читай
источник

V

Vanya in Natural Language Processing
Можешь посмотреть записи лекций по грамматикам и машинному обучению из топовых вузов
источник

A

Ali in Natural Language Processing
Nikolay V. Shmyrev
Курсов сами по себе без практики пользы много не приносят, надо с проектов начинать. Можно в каком-нибудь проекте с открытым кодом поучастовать.
Спасибо, Николай! А можете сориентировать где можно такие проекты искать? В частности что-то хоть отдаленно похожее на мою задачу - генерацию constrained writing текстов на родном языке?
источник

A

Ali in Natural Language Processing
Vanya
Можешь посмотреть записи лекций по грамматикам и машинному обучению из топовых вузов
Спасибо, Иван! Да, думаю ВШЭ и/или МФТИ мне подойдёт
источник

V

Vanya in Natural Language Processing
Ali
Спасибо, Иван! Да, думаю ВШЭ и/или МФТИ мне подойдёт
Мне лекции Сорокина из МФТИ понравились (по формальным грамматикам)
источник

NS

Nikolay V. Shmyrev in Natural Language Processing
Ali
Спасибо, Николай! А можете сориентировать где можно такие проекты искать? В частности что-то хоть отдаленно похожее на мою задачу - генерацию constrained writing текстов на родном языке?
https://github.com/huggingface/transformers/issues/6045 надо протестировать использование памяти в bart
источник

NS

Nikolay V. Shmyrev in Natural Language Processing
help wanted стоит
источник

АА

Алксан Аресир... in Natural Language Processing
Привет.
Есть джавовые бибилиотеки для работы со словами языка? например деление на морфемы
И прикол в том что надо ещё возможность задать свой язык и обучить систему своими данными
источник

NS

Nikolay V. Shmyrev in Natural Language Processing
https://github.com/minimaxir/textgenrnn можно ещё посмотреть, но там автор загрустил что-то
источник
2020 September 07

DZ

Dmitrii Zhurman in Natural Language Processing
Привет.
Не могли бы вы, пожалуйста, подсказать, какие есть библиотеки помимо Natasha, dateparser и rutimeparser для извлечения и, самое главное, нормализации временных конструкций?
источник

KS

Konstantin Smith in Natural Language Processing
Dmitrii Zhurman
Привет.
Не могли бы вы, пожалуйста, подсказать, какие есть библиотеки помимо Natasha, dateparser и rutimeparser для извлечения и, самое главное, нормализации временных конструкций?
Pullenti
источник