Ребят, если кто-нибудь шарит в nlp, подскажите пож.
Есть датафрейм в котором 2 колонки из слов. В 1 колонке слова относящиеся к машине (ее цвет, характеристики, цена за обслуживание и т.д). Во 2 колонке запрос покупателя, какую именно машину он ищет (не обязательно по параметрам перечисленным из колонки 1), например "она должна быть красивой, быстрой, не дорогой).
Требуется заполнить колонку 3 с % который означает на сколько колонка 1 подходит колонке 2.
Какой алгоритм использовать и на какие этапы разделить задачу, чтобы приблизительно оценить тематику слов и сопоставить на сколько % описание машины из колонки 1 подходят под вариант поиска машины из колонки 2?