Size: a a a

Natural Language Processing

2020 January 10

ck

cnstntn kndrtv in Natural Language Processing
Тоже остановился на этом. Что-то типа slot filling как в чат-ботах. Но это шаблоны, правила.
В задаче VisQA такое делают. Вопрос "is there a red apple on the table?" Должен стать кодом relate(filter(Table), filter(Red, filter(Apple)), TopOf)
И потом этот код применяют к визуальному графу сцены, построенному из картинки.
Ещё бы на подобные примеры посмотреть.
источник

A

Aragaer in Natural Language Processing
я пока еще ни на чем не остановился, все еще думаю. Если есть что-то, было бы интересно
источник

YB

Yuri Baburov in Natural Language Processing
Dmitry
Мы сделали несколько тестов на записях телефонных разговоров, по полноте транскриптов порядок в основном такой Tinkoff - Yandex - Google
Ну не знаю... У меня в ноябре на тестах был Яндекс лучше
источник

ck

cnstntn kndrtv in Natural Language Processing
Aragaer
я пока еще ни на чем не остановился, все еще думаю. Если есть что-то, было бы интересно
Мне надо было хоть какой-то прототип показать - написал по-быстрому правил из NER, синтаксического анализа и Semgrex/Tregexp (который есть в Spacy, но не задокументирован).
Как-то работает, но это просто правила. В проде такие подходы иногда лучше чем нейронки - правила понятны, объяснимы.
Но мне не нравится.
источник

A

Aragaer in Natural Language Processing
а, ну я делал через rasa когда-то, но мне хотелось character-level
источник

A

Aragaer in Natural Language Processing
источник

ck

cnstntn kndrtv in Natural Language Processing
То же самое выходит пока(
источник

M

Mairna in Natural Language Processing
А что вообще за задача была в этой статье? Вообще непонятно
источник

A

Aragaer in Natural Language Processing
там есть ссылки на предыдущие
источник

A

Aragaer in Natural Language Processing
https://habr.com/ru/post/347496/ - вот с этого началось
источник

W_

Wad _B in Natural Language Processing
Кто-нибудь находил готовые русские модели для deepspeech
источник
2020 January 12

D

Dmitry in Natural Language Processing
источник

D

Dmitry in Natural Language Processing
А это что за новость такая?
источник

D

Dmitry in Natural Language Processing
И точнее чем DeepSpeech??))
источник

YB

Yuri Baburov in Natural Language Processing
Dmitry
А это что за новость такая?
Новость от @nshmyrev , враппер тоже его.
@nshmyrev прокомментируешь?
Насчёт точности на deepspeech — это конечно же не так, в среднем у меня kaldi на 10% просаживается относительно deepspeech на большом корпусе, и это ещё без LM!!!
но если deepspeech тренировать на 60 часах из mozilla, то там точность будет в пол, конечно.
источник

NS

Nikolay Shmyrev in Natural Language Processing
Yuri Baburov
Новость от @nshmyrev , враппер тоже его.
@nshmyrev прокомментируешь?
Насчёт точности на deepspeech — это конечно же не так, в среднем у меня kaldi на 10% просаживается относительно deepspeech на большом корпусе, и это ещё без LM!!!
но если deepspeech тренировать на 60 часах из mozilla, то там точность будет в пол, конечно.
Да, моя.
источник

NS

Nikolay Shmyrev in Natural Language Processing
Цифры такие
источник

NS

Nikolay Shmyrev in Natural Language Processing
deepspeech 0.6  (1Gb)                                WER 21.10%

deepspeech tflite для андроида (50Mb)  WER 48.57%

Jasper (Nemo from Nvidia)                         WER 12.9%

Kaldi (aspire model)                                     WER 12.7 (серверная модель)

android-en-us                                              WER 14.3 (модель для андроида)
источник

NS

Nikolay Shmyrev in Natural Language Processing
можно скачать tedlium и протестировать самостоятельно.
источник

YB

Yuri Baburov in Natural Language Processing
т.е. тренировали только на английском tedlium (v3?)?
источник