Size: a a a

Глубинное обучение (группа)

2016 November 15

AB

Arcady Balandin in Глубинное обучение (группа)
ограничений типа "phrase structure grammar" как в MOSES тут же нет. любую пару можно использовать
источник

AB

Arcady Balandin in Глубинное обучение (группа)
пару языков
источник

YB

Yuri Baburov in Глубинное обучение (группа)
в оригинале что-то типа "я могу быстро ударить, если дать мне повод".
источник

YB

Yuri Baburov in Глубинное обучение (группа)
"i am moved" это не про то, просто у шекспира в корпусе не нашлось хорошего аналога, видимо.
источник

AB

Arcady Balandin in Глубинное обучение (группа)
"Why, Romeo, are you crazy? => why , art thou mad , mad ?" гы
источник

YB

Yuri Baburov in Глубинное обучение (группа)
нет, аналог был, просто немного неправильно перевелось:
SAMPSON
I strike quickly, being moved.
( http://nfs.sparknotes.com/romeojuliet/page_4.html )
в значении "I hit hard when I’m angry."
источник

AB

Arcady Balandin in Глубинное обучение (группа)
кстати, было бы хорошо для пары других языков эту репу переделать. там папку data как-то сложно программа анализирует. нужен на входе просто один файл в csv формате с двумя колонками. а в этой репе запутано как-то.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
в общем, смотря что конечно хочешь на выходе получить, но как по мне, качество совершенно игрушечное, несерьёзное
источник

AB

Arcady Balandin in Глубинное обучение (группа)
так и на входе маленький корпус.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
какая разница?
источник

YB

Yuri Baburov in Глубинное обучение (группа)
на больших корпусах BLEU порядка 24-38% всё равно.
источник

AB

Arcady Balandin in Глубинное обучение (группа)
с использованием этой же Seq2Seq от tensorflow?
источник

YB

Yuri Baburov in Глубинное обучение (группа)
грубо говоря, на уровне "от трети до половины слов неправильные или не на месте".
источник

YB

Yuri Baburov in Глубинное обучение (группа)
Arcady Balandin
с использованием этой же Seq2Seq от tensorflow?
какая разница? я же говорю — это state of the art такой. плохо применимый для реальных не игрушечных задач.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
и дело не только в размере корпуса.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
нужно что-то для корректировки возникающих ошибок и смысловых нестыковок, какую-то "соображалку". а её нет.
источник

AB

Arcady Balandin in Глубинное обучение (группа)
хм, тут один использовал корпус текстов ложбан-английский с помощью MOSES и результат скажем так не совсем уж плохой. Но в качестве корпуса там были предложения из Tatoeba.org а также корпус из 2500 предложений, которые предназначены чтобы иллюстрировать разные аспекты языка ложбан.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
меня результат, когда часто возникают существенные для понимания искажения смысла, не устраивает. не знаю, как тебя.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
когда человек переводит, абсолютно не разбираясь в теме, получается чуть получше, но в общем примерно так же
источник

AB

Arcady Balandin in Глубинное обучение (группа)
а есть какие-либо другие примеры такого искажения смысла?
источник