Size: a a a

2019 September 14

I

Ivan in Scrapy
Elisei Badanin
А ещё какие-то данные есть?
есть, но зацепиться больше не за что, только заголовок, остальные данные отличаются
источник

EB

Elisei Badanin in Scrapy
Тогда в любом случае будет необходима ручная модерация
источник

EB

Elisei Badanin in Scrapy
А так доставай все, что можешь из заголовка для начала
источник

EB

Elisei Badanin in Scrapy
Много этим занимался, там от ситуации решение меняется координально
источник

К

Кирилл in Scrapy
Ivan
истересует такой вопрос:
спарсил данные, например название товара с разных сайтов, нужно их сопоставить. при том что сформулирован заголовок может быть по разному -  отличаться порядок слов.
как их сравнить?
что-то примерно такое https://nlpforhackers.io/wordnet-sentence-similarity/
источник

EB

Elisei Badanin in Scrapy
Ток для товаров не очень подойдёт
источник

EB

Elisei Badanin in Scrapy
Хотя можно попробовать
источник

К

Кирилл in Scrapy
Этот почти готовый вариант, и его можно быстро опробовать) Если не подойдет, то что-то другое
источник

iz

izzz zzi in Scrapy
Что то общее должно быть у товаров
источник

iz

izzz zzi in Scrapy
Названия
источник

I

Ivan in Scrapy
мне хотябы максимальную похожесть найти
источник

iz

izzz zzi in Scrapy
По нему и работай
источник

iz

izzz zzi in Scrapy
Ivan
мне хотябы максимальную похожесть найти
in 😁
источник

I

Ivan in Scrapy
не
источник

iz

izzz zzi in Scrapy
По хорошему бд вяжи
источник

iz

izzz zzi in Scrapy
И с ней работай
источник

I

Ivan in Scrapy
так и делаю
источник

I

Ivan in Scrapy
вот думаю над вариантом убирать всю кирилицу и сравнивать
источник

I

Ivan in Scrapy
производитель и обьем одинаковые в названии
источник

К

Кирилл in Scrapy
скинь примеры
источник