Уважаемые друзья, подскажите, каким инструментом можно приводить словосочетания на русском в более-менее правильный человекочитаемый вид?
Например, дано:
'роза купить гатчина'
Хотелось бы получить:
'купить розу в Гатчине'
заранее благодарен за ответы!
Я готового инструмента не знаю.
Что можно попробовать сделать: сделать довольно сложную машиннообученную конструкцию, которая бы из кривого словосочетания делала правильное.
Как сделать:
1. Берёшь много "нормальных" фраз, и "портишь" их некоторыми эвристиками
2. На этих данных обучаешь seq-2-seq нейронку с атеншном и копированиями (типа как для перевода), которая переводила бы с "запросного" языка на "обычный".
Вместо голого seq-2-seq'а можно попробовать замутить что-нибудь с синтаксическим разбором (ведь по сути тут надо правильно восстановить связи между словами и на основе этих связей сгенерировать правильное предложение), но у меня такого опыта нет.