Size: a a a

Natural Language Processing

2019 December 09

V

Vlad in Natural Language Processing
А с какой целью вы их визуализируете потом? Просто личный интерес или какую-то задачу решаете?
источник

V

V in Natural Language Processing
Vlad
А с какой целью вы их визуализируете потом? Просто личный интерес или какую-то задачу решаете?
конечная цель - предоставить одному сообществу инструмент для визуальной навигации по произвольным наборам документов (текстов, изображений и их комбинаций), и бонусом "семантический" поиск по документам (поверх полученных векторов легко можно развернуть ANN search).
источник

V

V in Natural Language Processing
пока что делаю без погони за высокой производительностью, но с претензией на точность.
источник

A

Aragaer in Natural Language Processing
Timur
в элмо тоже char-level по сути, но они там свёртками проходятся по эмбеддингам символом из из этого строят эмбеддинги слов
Да, я такое и видел. Спасибо за ссылки, вечером посмотрю.
источник

NK

Nikolay Karelin in Natural Language Processing
Krep Kospit
Хочу сделать свой "велосипед" с генерацией стихов, чтобы они включали заранее заданные слова.
Я бы тогда начал с примера, который генерит стихи (на Хабре, paperswithcode, ...), и посмотрел, какие библиотеки там нужны.
источник

KK

Krep Kospit in Natural Language Processing
Nikolay Karelin
Я бы тогда начал с примера, который генерит стихи (на Хабре, paperswithcode, ...), и посмотрел, какие библиотеки там нужны.
Понял, благодарю!
источник

V

V in Natural Language Processing
возвращаясь к моделям для русского языка: периодически вижу в Сети примеры генерации текста на русском языке с помощью GPT-2, но внятной предобученной модели для русского языка не встречал. может кто находил/работал с/обучал русскоязычную GPT-2?
источник

V

Viktor in Natural Language Processing
V
возвращаясь к моделям для русского языка: периодически вижу в Сети примеры генерации текста на русском языке с помощью GPT-2, но внятной предобученной модели для русского языка не встречал. может кто находил/работал с/обучал русскоязычную GPT-2?
да на англ даже нормальной нет как по мне
источник

Y

Yurii in Natural Language Processing
Подскажите. Предположим есть английское существительное,  при переводе на русский оно может изменить часть речи на русский глагол например? Тоесть может ли меняться часть речи при переводе. Возможно как часть фразы.
источник

NS

Nikolay Shmyrev in Natural Language Processing
Yurii
Подскажите. Предположим есть английское существительное,  при переводе на русский оно может изменить часть речи на русский глагол например? Тоесть может ли меняться часть речи при переводе. Возможно как часть фразы.
he had a breakfast -> он позавтракал
источник

Y

Yurii in Natural Language Processing
Nikolay Shmyrev
he had a breakfast -> он позавтракал
Хм, спасибо. Получается чтобы все сошлось нужно слово позавтракал разбирать на 'был завтрак'
источник

A

Aragaer in Natural Language Processing
имел завтрак
источник

Y

Yurii in Natural Language Processing
Aragaer
имел завтрак
ну или так) главное не попутать смысл еще данного выражения в контексте яблочного пирога)
источник
2019 December 10

ck

cnstntn kndrtv in Natural Language Processing
David (ddale) Dale
Хм, я сейчас медленно ползу к созданию своего компактного USE чисто для русского. Можно было бы объединить усилия)
А в чем тебе нужна помощь? Может быть есть начатый репозиторий, список todo?
источник

D(

David (ddale) Dale in Natural Language Processing
cnstntn kndrtv
А в чем тебе нужна помощь? Может быть есть начатый репозиторий, список todo?
Сейчас я на раннем этапе, репы ещё нету.
Больше всего поможет подобрать побольше разных downstream задачек (семантическая близость, классификация текстов, матчинг ответов с вопросами, и т.п.) на русском языке, на которых вообще оценивать качество эмбеддингов можно будет.
источник

ck

cnstntn kndrtv in Natural Language Processing
David (ddale) Dale
Сейчас я на раннем этапе, репы ещё нету.
Больше всего поможет подобрать побольше разных downstream задачек (семантическая близость, классификация текстов, матчинг ответов с вопросами, и т.п.) на русском языке, на которых вообще оценивать качество эмбеддингов можно будет.
Попробую заняться. Через неделю напишу, что вышло)
Все на русском? По идее нужно просто собрать все компетишны для таких задач, датасеты из них. Я вроде такие репозитории видел. Возможно у deepppavlov
источник

Y

Yurii in Natural Language Processing
Подскажите простейшие операции контакенация, приведение к различным регистрам и прочее со строками. По скорости будет значитально отличаться между языками питон и С++ например?
источник

AK

Anton Kiselëv in Natural Language Processing
Наверно от конкретных строк зависит, в Python по умолчанию они с Юникодом, а на C++ не факт. Еще в Питоне автоматически их нормализация происходит, а в C++ скорее всего ее нужно дополнительно запускать.
источник

AZ

Alexandr Zamaraev in Natural Language Processing
Yurii
Подскажите простейшие операции контакенация, приведение к различным регистрам и прочее со строками. По скорости будет значитально отличаться между языками питон и С++ например?
Будут очень по разному. В 3-ем python-е строки unicode а в С++ - как укажишь.
Так что то же приведение может быть очень разное по скорости.
источник

Y

Yurii in Natural Language Processing
А если в обоих языках будет уникод?
источник