Слово как там пример выше был «провад» нормализуется в «провал» и «провод». Как нормализовать я думаю отвечать не нужно. Можно нейронку прикрутить, можно готовые решение и апи юзать. Плисковику скарливаются оба эти слова а уже по количество вхождений и определять релевантность.
В том что человек может написать "красный проводочек 6 метров", "длинный проводок", "провод dvi на HDMI в наличии"
Да только если они могли себе позволить входные данные брать как минимум из отзывов о фильмах и трекинга. Как из только лишь каталога товаров это сделать? Статья интересная, но не в этих реалиях
Да только если они могли себе позволить входные данные брать как минимум из отзывов о фильмах и трекинга. Как из только лишь каталога товаров это сделать? Статья интересная, но не в этих реалиях
я выше и написал, зависит от того, сколько заказчик готов на поиск потратить
Просто от стека зависит. В случае с фильмами тут да, сложная система нужна. Но с товарами как по мне попроще. Если человек опечатался — это понятно. Но если человек вводит проводочек то его на ферму уменьшительно-ласкательных
если человек ввёл "проводочек" и нашёл то, что нужно, можно предположить, что другой человек тоже захочет этот товар или товар из этой категории при запросе "проводочка"
Ну это предполагается нейронная сеть тогда. Это хорошо если человек все же нашел. Тоесть мы собираем все неудачные его попытки найти до удачного и там уже анализируем. А если нет?
Просто от стека зависит. В случае с фильмами тут да, сложная система нужна. Но с товарами как по мне попроще. Если человек опечатался — это понятно. Но если человек вводит проводочек то его на ферму уменьшительно-ласкательных
Почему считаешь что пользователь должен вводить только то что тебе кажется приемлемым?
Интересная на самом деле тема. Не так давно поиск делал по сайту службы доставки и естественно анализировал, что пользователи ищут. Дичи вроде «помодорки» и «огурчики» не было. Зато с помощью нормализации и релевантности сделал в админке предложения на введение новых блюд исходя из запросов
«Салат с памидорами». Предлоги отсеиваются. Оставшиеся слова сначала исправляютсяс помощью «спеллер» от яндекса, а уже по семантическому совпадению с ключевыми выдавал товары с релевантностью от 90%