Size: a a a

Natural Language Processing

2020 March 12

AB

Arcady Balandin in Natural Language Processing
Maksim Vladimirovich
Под линуксы ничего нет, только через API гугл, Яндекс, Амазон
Да мне бы вообще на js/wasm
источник

YB

Yuri Baburov in Natural Language Processing
Sebastian Pereira
в spacy-ru ?
Да
источник

SP

Sebastian Pereira in Natural Language Processing
Отлично!
источник

SS

Sergey Shulga in Natural Language Processing
Yuri Baburov
В старом ner появились собственные вектора уже, поэтому он у тебя работает на небольшом количестве данных. Через несколько дней у нас появится версия чистого нер с векторами фасттекст для 2.2.
О! Вы молодцы! Очень жду!
источник

VR

Vladimir R in Natural Language Processing
Arcady Balandin
Да мне бы вообще на js/wasm
А ты можешь запрос делать на web api через js?
источник

AB

Arcady Balandin in Natural Language Processing
Vladimir R
А ты можешь запрос делать на web api через js?
Ну вот не хотелось бы, хочу оффлайности. Хотя такотрон похоже в tensor flow.js не пойдет.
источник

AB

Arcady Balandin in Natural Language Processing
Даже идеологически инференс это чистая статика, сервер в идеале не нужен
источник

VR

Vladimir R in Natural Language Processing
Просто автономность заберёт 1) загрузку довольно большой модели при каждой загрузке страницы до 200 мб 2) очень много ресурсов процессора при инференсе 3) кросбраузерная поддержка будет выносом мозга
источник

AB

Arcady Balandin in Natural Language Processing
Vladimir R
Просто автономность заберёт 1) загрузку довольно большой модели при каждой загрузке страницы до 200 мб 2) очень много ресурсов процессора при инференсе 3) кросбраузерная поддержка будет выносом мозга
Ну вот оффлайн версия tts от Гугла на Андроиде сколько весит? Несколько Мб.
источник

VR

Vladimir R in Natural Language Processing
Там скорее всего не нейронная сетка, а словарь txt->mp3
источник

VR

Vladimir R in Natural Language Processing
Такую не сложно написать я думаю, самое сложное поддержка аудиокодека
источник

AB

Arcady Balandin in Natural Language Processing
Мне словарь не нужен. Я из фонетического представления хочу  tts
источник

VR

Vladimir R in Natural Language Processing
Попробуй в английский tts забить русский транслит на гугле, тогда примерно сможешь оценить качество такого решения на выходе....
источник

VR

Vladimir R in Natural Language Processing
Если оно тебя устраивает, то думаю у тебя выйдет не хуже
источник
2020 March 13

V

Vlad in Natural Language Processing
Arcady Balandin
Мне словарь не нужен. Я из фонетического представления хочу  tts
Это практически и есть RHVoice, попробуйте его, может вас устроит. Работает везде, кроме айфонов
источник

V

Vlad in Natural Language Processing
Я его в дипломе использовал у себя, могу дать инструкцию по запуску в линуксе. Правда его вроде обновляли с того момента, наверное лучше пробовать сразу последнюю версию
источник

ck

cnstntn kndrtv in Natural Language Processing
Привет. Посоветуйте библиотеку типа Yargy для cfg, но шустрее.
Пока писал регекспы для дат, денег, автомобильных номеров и прочих токенов из букв+цифр+пунктуации. И естественно возникли коллизии.
Yargy хорош, но медленный по сравнению с регекспами.
источник

ck

cnstntn kndrtv in Natural Language Processing
cnstntn kndrtv
Привет. Посоветуйте библиотеку типа Yargy для cfg, но шустрее.
Пока писал регекспы для дат, денег, автомобильных номеров и прочих токенов из букв+цифр+пунктуации. И естественно возникли коллизии.
Yargy хорош, но медленный по сравнению с регекспами.
Гуглить и сам могу. Вот бы кто опытом поделился.
источник

V

Vlad in Natural Language Processing
cnstntn kndrtv
Привет. Посоветуйте библиотеку типа Yargy для cfg, но шустрее.
Пока писал регекспы для дат, денег, автомобильных номеров и прочих токенов из букв+цифр+пунктуации. И естественно возникли коллизии.
Yargy хорош, но медленный по сравнению с регекспами.
А насколько медленнее? У меня Наташа ner, которая на yargy сделана, работает за 90-140мс на вычленение всех сущностей, что она умеет
источник

ck

cnstntn kndrtv in Natural Language Processing
Vlad
А насколько медленнее? У меня Наташа ner, которая на yargy сделана, работает за 90-140мс на вычленение всех сущностей, что она умеет
Не сравнивал честно говоря. Но вот для примера ner на нс+fasttext работает со скоростью около 50 МС, Natasha - так же 100+/-.
Из этого сделал вывод (возможго неправильный)
И если Ярги это слои над регекспами, то это точно медленнее чем чистые регекспы.
источник