Size: a a a

2019 September 14

МС

Михаил Синегубов in Scrapy
псс, народ, тут была инфа про суд с линкедом, говроят что теперь можно без зазрения совести их скрапить.
источник

МС

Михаил Синегубов in Scrapy
источник

МС

Михаил Синегубов in Scrapy
или я опять все не так понял ? 😂
источник

К

Кирилл in Scrapy
Почитай чат выше, пару дней  назад ребята обсуждали это
источник

МС

Михаил Синегубов in Scrapy
а, блин, тупанул.
печанька же говорил именно про эту статью....
"Как впрочем, ничего нового"©
😂
источник

i

ildar in Scrapy
Ivan
там всего 600 товаров на сравнение, так что то что плохо сравнит буду руками делать, и связывать по url товаров, а потом по url буду фильтровать
если это единоразовая работа да на 600 позиций - проще посадить девочку один раз, при условии что ковыряние за день с этими нейросетями или другими сравнениями не взлетит. А еще можно попробовать у них запросить прайсы для оптовиков-дилеров-дистрибов выгрузку с 1с и бла-бла, обычно там бывают в позиции какой-нибудь артикул и название, или UPC/MFG код, по-которому отсоответствуется.
источник

К

Кирилл in Scrapy
хотя, я бы ещё посмотрел на саму страницу, может быть там таки есть где-то ID, а мы тут паримся
источник

i

ildar in Scrapy
насчет слов, у яндекса есть инструменты по токенизации т.ч. кириллицы
источник

i

ildar in Scrapy
ну вообще несколько странно задача звучит - зачем сравнивать товар с трех сайтов, вангую там заказчику на самом деле явно немножко не то надо)
источник

К

Кирилл in Scrapy
ildar
ну вообще несколько странно задача звучит - зачем сравнивать товар с трех сайтов, вангую там заказчику на самом деле явно немножко не то надо)
не, ну задача достаточно тривиальна, сравнивать цены с разных сайтов, чтоб выбрать самую низкую
источник

i

ildar in Scrapy
источник

i

ildar in Scrapy
Кирилл
не, ну задача достаточно тривиальна, сравнивать цены с разных сайтов, чтоб выбрать самую низкую
а ну так-то да, тока обычно на сайтах цены для розницы, а для всяких оптовиков там другие цены.  А еще некоторые оптовики странные могут отгружать цены только прайсами какими-нибудь или всякими извращениями аля wsdl там или xml-api или yandex market yaml. Ну, надеюсь он все выяснил.
источник

i

ildar in Scrapy
для всякой сегментации и токенизации эта штука самая мощная, выше питоновую обвязку линканул
https://yandex.ru/dev/mystem/
посмотри там на примеры лемматизации - по-крайней мере всякие суффиксы-шмуффиксы ободрать легче станет. и потом уже сравнивать в духе сравнения set's или еще какой текстовой хешизации на-коленке
источник

I

Ivan in Scrapy
ildar
а ну так-то да, тока обычно на сайтах цены для розницы, а для всяких оптовиков там другие цены.  А еще некоторые оптовики странные могут отгружать цены только прайсами какими-нибудь или всякими извращениями аля wsdl там или xml-api или yandex market yaml. Ну, надеюсь он все выяснил.
тут цены конкурентов сравниваются
источник

i

ildar in Scrapy
еще могу посоветовать сравнивать с яндекс-маркетом в своем по-крайней мере городе.
источник

К

Кирилл in Scrapy
Ivan
Кофе зерновой LavAzza Qualita Rossa (оригинал Аскания) 1 кг
скинь ссылки на эти три товара
источник

i

ildar in Scrapy
а еще я думаю что эта задача не должна прям 100% соответствий находить. достаточно какой-то процент позиций хотя-бы самых ходовых подтягивать.
источник

i

ildar in Scrapy
но как именно поковырять ML для дома для семьи задачка хорошая, чисто для развлекухи. Если завала нет)
источник

I

Ivan in Scrapy
Кирилл
скинь ссылки на эти три товара
источник

i

ildar in Scrapy
Кирилл
скинь ссылки на эти три товара
бхаха, облом)
источник