Size: a a a

Natural Language Processing

2021 March 30

И

Известно Кто... in Natural Language Processing
Пробовал Берт, но насколько я понимаю есть что то более подходящее
источник

P

Phd Guidance in Natural Language Processing
источник

DM

Darya Moroz in Natural Language Processing
Всем привет!

В этом году DeepPavlov выбрали в качестве наставнической организации Google Summer of Code for Summer 2021 🔥

GSoC – это международная программа для студентов старше 18 лет, позволяющая участвовать в работе над открытыми проектами. В этом году студенты в течение 10 недель (с 7 июня по 16 августа) могут оттачивать навыки программирования под присмотром наставников-волонтеров из DeepPavlov и получать стипендию от Google.

Мы подготовили статью, в которой можно подробнее узнать о приеме и задачах в DeepPavlov, а также просто про сам процеcс отбора на GSoC ✌️

http://bit.ly/DPGSoC2021Habr
источник

IK

Ilya Kazakov in Natural Language Processing
Известно Кто
Здравствуйте! Не подскажете каких нибудь специализированных трансформеров для doc2vec?
В каком смысле специализированных? Для конкретной задачи имеет смысл на своём корпусе тюнить (или обучать любой другой векторизатор). Да и от задачи зависит, иногда и bow + svm сота даёт.
источник

VM

Valentin Malykh in Natural Language Processing
всем привет, в конце прошлого года мы провели NLP workshop, но несколько затянули с выкладыванием видео, исправляемся: https://www.youtube.com/playlist?list=PLHvlTBWld13OU0WgaVntkkn3P-ZfWXL9u
http://huawei-university.github.io/nlpworkshop
источник

AE

Anton Eryomin in Natural Language Processing
Коллеги, а где бы посмотреть почитать (кроме офф документации) про построения систем поиска ближайшего вектора, кейс в целом классический берем предложение, кодируем его, ищем ближайшего соседей и выдаем таких топ Н. Кроме FAISS куда можно еще посмотреть ?
источник

И

Известно Кто... in Natural Language Processing
Ilya Kazakov
В каком смысле специализированных? Для конкретной задачи имеет смысл на своём корпусе тюнить (или обучать любой другой векторизатор). Да и от задачи зависит, иногда и bow + svm сота даёт.
понятно что надо тюнить, просто видел здесь сообщения про use как векторайзер (вроде как). вот и стало интересно есть ли что то такое
источник

VS

Vasya Stepanov in Natural Language Processing
Anton Eryomin
Коллеги, а где бы посмотреть почитать (кроме офф документации) про построения систем поиска ближайшего вектора, кейс в целом классический берем предложение, кодируем его, ищем ближайшего соседей и выдаем таких топ Н. Кроме FAISS куда можно еще посмотреть ?
https://github.com/erikbern/ann-benchmarks/ как вариант один из этих алгоритмов которые в бенчмарке участвуют
источник

AE

Anton Eryomin in Natural Language Processing
Спасибо за ссылку, буду смотреть.
источник

VB

Vladimir Bougay in Natural Language Processing
Anton Eryomin
Коллеги, а где бы посмотреть почитать (кроме офф документации) про построения систем поиска ближайшего вектора, кейс в целом классический берем предложение, кодируем его, ищем ближайшего соседей и выдаем таких топ Н. Кроме FAISS куда можно еще посмотреть ?
источник

AE

Anton Eryomin in Natural Language Processing
Спасибо вам большое! буду ознакамливаться
источник

РН

Роман Некрасов... in Natural Language Processing
Добрый вечер!

Хотелось бы узнать мнение сообщества об архитектуре гугловской TabNet:

1. Есть ли опыт использования?
2. Удалось ли получить пользу в практических задачах?
3. Что думаете о направлении tabular deep learning?
источник
2021 March 31

VM

Victor Maslov in Natural Language Processing
всем привет
нет ли у кого под рукой каких-нить больших русскоязычных чат-логов для обучения?
источник

MM

Mikhail Mashkovich in Natural Language Processing
Victor Maslov
всем привет
нет ли у кого под рукой каких-нить больших русскоязычных чат-логов для обучения?
Да в телеге можно взять и экспортнуть любой крупный чат.
источник

VM

Victor Maslov in Natural Language Processing
Mikhail Mashkovich
Да в телеге можно взять и экспортнуть любой крупный чат.
в телеге ггнуха одна )
когда-то мне попадались логи в болталке какой-то браузерной игры на несколько десятков мегабайт, но это было очень давно, не найду
а у ирц-каналов ведутся логи только если они очень технические, а мне нужны диалоги с более обычным общением
источник

AP

Alexey Potapov in Natural Language Processing
Cookie Thief
возьми и напиши, в чем проблема
Это как в talk-to-books ?
источник

CT

Cookie Thief in Natural Language Processing
Ох какой раритет подняли)
источник

DK

Daniel Kornev in Natural Language Processing
David Dale
Насколько я понял, вопрос был про скорее про то, сколько батчей подряд нужно аккумулировать градиент.

К сожалению, лично у меня ответа нету.

Я сам обычно аккумулирую градиент так, чтобы на один градиентный шаг приходилось хотя бы несколько десятков примеров, но у меня нет убедительного обоснования, почему делать так надо.
Спасибо за ответ, Давид!
источник

MK

Max Kuznetsov in Natural Language Processing
Victor Maslov
всем привет
нет ли у кого под рукой каких-нить больших русскоязычных чат-логов для обучения?
https://m.habr.com/ru/company/icl_services/blog/548244/ там есть ссылка, которая поломана, но возможно ее можно "починить"
источник

A

Alexander in Natural Language Processing
Добрый день.
Подскажите, пожалуйста, какое-нибудь руководство (уроки, примеры) по SpaCy для нубов на русском языке. Интересует решение задач NER.
источник