Телеграмм чат группы natural_language

2019 December 09

V

Vlad in Natural Language Processing

А с какой целью вы их визуализируете потом? Просто личный интерес или какую-то задачу решаете?

источник

17:47пожаловаться #1

V

V in Natural Language Processing

Vlad

А с какой целью вы их визуализируете потом? Просто личный интерес или какую-то задачу решаете?

конечная цель - предоставить одному сообществу инструмент для визуальной навигации по произвольным наборам документов (текстов, изображений и их комбинаций), и бонусом "семантический" поиск по документам (поверх полученных векторов легко можно развернуть ANN search).

источник

17:52пожаловаться #2

V

V in Natural Language Processing

пока что делаю без погони за высокой производительностью, но с претензией на точность.

источник

17:58пожаловаться #3

A

Aragaer in Natural Language Processing

Timur

в элмо тоже char-level по сути, но они там свёртками проходятся по эмбеддингам символом из из этого строят эмбеддинги слов

Да, я такое и видел. Спасибо за ссылки, вечером посмотрю.

источник

17:59пожаловаться #4

NK

Nikolay Karelin in Natural Language Processing

Krep Kospit

Хочу сделать свой "велосипед" с генерацией стихов, чтобы они включали заранее заданные слова.

Я бы тогда начал с примера, который генерит стихи (на Хабре, paperswithcode, ...), и посмотрел, какие библиотеки там нужны.

источник

19:02пожаловаться #5

KK

Krep Kospit in Natural Language Processing

Nikolay Karelin

Я бы тогда начал с примера, который генерит стихи (на Хабре, paperswithcode, ...), и посмотрел, какие библиотеки там нужны.

Понял, благодарю!

источник

19:10пожаловаться #6

V

V in Natural Language Processing

возвращаясь к моделям для русского языка: периодически вижу в Сети примеры генерации текста на русском языке с помощью GPT-2, но внятной предобученной модели для русского языка не встречал. может кто находил/работал с/обучал русскоязычную GPT-2?

источник

19:58пожаловаться #7

V

Viktor in Natural Language Processing

V

возвращаясь к моделям для русского языка: периодически вижу в Сети примеры генерации текста на русском языке с помощью GPT-2, но внятной предобученной модели для русского языка не встречал. может кто находил/работал с/обучал русскоязычную GPT-2?

да на англ даже нормальной нет как по мне

источник

20:03пожаловаться #8

Y

Yurii in Natural Language Processing

Подскажите. Предположим есть английское существительное, при переводе на русский оно может изменить часть речи на русский глагол например? Тоесть может ли меняться часть речи при переводе. Возможно как часть фразы.

источник

20:32пожаловаться #9

NS

Nikolay Shmyrev in Natural Language Processing

Yurii

Подскажите. Предположим есть английское существительное, при переводе на русский оно может изменить часть речи на русский глагол например? Тоесть может ли меняться часть речи при переводе. Возможно как часть фразы.

he had a breakfast -> он позавтракал

источник

20:49пожаловаться #10

Y

Yurii in Natural Language Processing

Nikolay Shmyrev

he had a breakfast -> он позавтракал

Хм, спасибо. Получается чтобы все сошлось нужно слово позавтракал разбирать на 'был завтрак'

источник

20:57пожаловаться #11

A

Aragaer in Natural Language Processing

имел завтрак

источник

20:57пожаловаться #12

Y

Yurii in Natural Language Processing

Aragaer

имел завтрак

ну или так) главное не попутать смысл еще данного выражения в контексте яблочного пирога)

источник

20:59пожаловаться #13

2019 December 10

ck

cnstntn kndrtv in Natural Language Processing

David (ddale) Dale

Хм, я сейчас медленно ползу к созданию своего компактного USE чисто для русского. Можно было бы объединить усилия)

А в чем тебе нужна помощь? Может быть есть начатый репозиторий, список todo?

источник

09:59пожаловаться #14

D(

David (ddale) Dale in Natural Language Processing

cnstntn kndrtv

А в чем тебе нужна помощь? Может быть есть начатый репозиторий, список todo?

Сейчас я на раннем этапе, репы ещё нету.
Больше всего поможет подобрать побольше разных downstream задачек (семантическая близость, классификация текстов, матчинг ответов с вопросами, и т.п.) на русском языке, на которых вообще оценивать качество эмбеддингов можно будет.

источник

10:02пожаловаться #15

ck

cnstntn kndrtv in Natural Language Processing

David (ddale) Dale

Сейчас я на раннем этапе, репы ещё нету.
Больше всего поможет подобрать побольше разных downstream задачек (семантическая близость, классификация текстов, матчинг ответов с вопросами, и т.п.) на русском языке, на которых вообще оценивать качество эмбеддингов можно будет.

Попробую заняться. Через неделю напишу, что вышло)
Все на русском? По идее нужно просто собрать все компетишны для таких задач, датасеты из них. Я вроде такие репозитории видел. Возможно у deepppavlov

источник

10:29пожаловаться #16

Y

Yurii in Natural Language Processing

Подскажите простейшие операции контакенация, приведение к различным регистрам и прочее со строками. По скорости будет значитально отличаться между языками питон и С++ например?

источник

12:25пожаловаться #17

AK

Anton Kiselëv in Natural Language Processing

Наверно от конкретных строк зависит, в Python по умолчанию они с Юникодом, а на C++ не факт. Еще в Питоне автоматически их нормализация происходит, а в C++ скорее всего ее нужно дополнительно запускать.

источник

12:30пожаловаться #18

AZ

Alexandr Zamaraev in Natural Language Processing

Yurii

Подскажите простейшие операции контакенация, приведение к различным регистрам и прочее со строками. По скорости будет значитально отличаться между языками питон и С++ например?

Будут очень по разному. В 3-ем python-е строки unicode а в С++ - как укажишь.
Так что то же приведение может быть очень разное по скорости.

источник

12:30пожаловаться #19

Y

Yurii in Natural Language Processing

А если в обоих языках будет уникод?

источник

12:32пожаловаться #20