Size: a a a

Natural Language Processing

2021 November 02

TM

Toemik Mnemonic in Natural Language Processing
ударений правда не будет. но зато максимальный охват и официальность данных
источник

SS

Sergey Sikorskiy in Natural Language Processing
Ударение есть в wiktionary. Но его надо уметь парсить.
источник

TM

Toemik Mnemonic in Natural Language Processing
источник

SM

Sergei Markoff in Natural Language Processing
BTW, мы опубликовали русскоязычную версию DALL-E: https://habr.com/ru/company/sberdevices/blog/586926/
источник

AG

Alexander Gambashidz... in Natural Language Processing
кто-то обучал рл агентов на эмбеддингах текстов ? есть какие-то примеры проектов у кого-нибудь или статьи ? хочется какой-то бейзлайн иметь и не шагать в пустоту
источник

FF

Futorio Franklin in Natural Language Processing
источник

FF

Futorio Franklin in Natural Language Processing
Выглядит концептуально
источник

SM

Sergei Markoff in Natural Language Processing
Ну тут не надо ждать таких сложных умений от XL-модельки :)
источник

d

dePuff in Natural Language Processing
А как можно сохранить форматирование (rtf, html и т.п.) исходного текста, например, в задаче перевода?

В ситуации, когда разметка более-менее богатая и нарезать на кусочки, которые переводятся сами по себе - так себе идея.
источник

ID

Ivan Dolgov in Natural Language Processing
можно попробовать заводить специальные символы для “копирования” из src в tgt. Но я это применял для того, чтобы модель не переводила термины всякие с английского в какой-нибудь другой.
источник

ID

Ivan Dolgov in Natural Language Processing
типа там Apple is big software company. -> $Apple$ is big software company -> $Apple$ - большая софтверная компания
источник

ID

Ivan Dolgov in Natural Language Processing
для разметки можно похожее сделать
источник

V

Vic in Natural Language Processing
круто, уже запостил в нашем чате
источник

ไซส์ in Natural Language Processing
здравствуйте
я залётная птица в обработке языка, так что проблема, описанная мной, может быть слишком простой.

у меня есть частично бессвязный набор символов(только буквы без пробелов), и мне нужно найти все осмысленные русские слова(неважно в какой морфологической форме). как это можно сделать?
источник

N

Natalia in Natural Language Processing
нигде :)))
источник

N

Natalia in Natural Language Processing
ну в смысле да, сам список из открытых данных берётся, а дальше удачи вам с ударениями, там работы на очень много часов :)
источник

PG

Pavel Gulyaev in Natural Language Processing
можно скачать из викидаты все русские города, а потом по привязке к вики статьям взять их ударения
источник

N

Natalia in Natural Language Processing
оно вам все населённые пункты не покроет
источник

N

Natalia in Natural Language Processing
я вам говорю как человек, который это всё ручками делал
источник

PG

Pavel Gulyaev in Natural Language Processing
в оригинальной просьбе не было ВСЕХ населённых пунктов =)
источник