Мы так же обучали это ток на парафразах одного языка) далее я пробовал так же обучать на переводах и это не плохо зашло в токсике в 2020 году, там я смог взять топ20 лб на похожем подходе на каггле
Для создания своего простого LABSE необходимо иметь парафразы на разных языках и применить констрактив ленинг + некоторые оптимизационные фичи , что уже усложнит реализацию
кстати, порекомендуйте куда смотреть в части связывания сущностей и извлечения отношений. К примеру, из фразы "паспорт серия 4444 номер 455555, выдан ОВД Москва 12.05.2020, получить структуру {Паспорт: {серия: 4444}, {номер:....} и так далее. У кого то были такие опыты и если да, то в каком фреймворке?
SDK Pullenti умеет работать с паспортами и другими документами
кстати, порекомендуйте куда смотреть в части связывания сущностей и извлечения отношений. К примеру, из фразы "паспорт серия 4444 номер 455555, выдан ОВД Москва 12.05.2020, получить структуру {Паспорт: {серия: 4444}, {номер:....} и так далее. У кого то были такие опыты и если да, то в каком фреймворке?
Привет) подскажите пожалуйста какие есть инструменты, для синтеза речи с передачей вариции и стиля? Ps пробал flowtron от nvidia, но его очень трудно подружить с OSX
Привет) подскажите пожалуйста какие есть инструменты, для синтеза речи с передачей вариции и стиля? Ps пробал flowtron от nvidia, но его очень трудно подружить с OSX
есть отдельный канал "Распознавание речи". М.б. там знают
Здравствуйте! Вопрос о list(sentenize(text)) в Разделе - возможно ли в выдаче получать только закавыченные элементы в виде обычного списка? Без слов Substring и цифр. Спасибо!
Здравствуйте! Вопрос о list(sentenize(text)) в Разделе - возможно ли в выдаче получать только закавыченные элементы в виде обычного списка? Без слов Substring и цифр. Спасибо!