Size: a a a

2021 November 10

ҒА

Ғани Асубай... in PHP DevConf
Есть готовая ссылка по которому я получаю контент и мне нужна цена, но она высчитывается в js
источник

ҒА

Ғани Асубай... in PHP DevConf
Span приходит пустым потому что как я понял js не отработал
источник

SR

Serik RAKHMETOV in PHP DevConf
чем парсишь?
источник

ҒА

Ғани Асубай... in PHP DevConf
Просто php шным способом пробовал
источник

ҒА

Ғани Асубай... in PHP DevConf
Get content
источник

ҒА

Ғани Асубай... in PHP DevConf
Искал в инете не нашел
источник

ҒА

Ғани Асубай... in PHP DevConf
Может быть не так искал
источник
2021 November 11

AM

Alex Molchanov in PHP DevConf
Вариант
1. смотреть куда на js летит запрос за ценой, если он летит и отправлять такой же самому
2. Делать разобфускацию кода (скорее всего разминификацию и копаться в этом дерьме) js и смотреть логику вычисления и делать вычисления на своей стороне
3 использовать сторонние движки, типа хромиума. Я хз, как там эта библа называется, надо погуглить, точно есть для ноды
источник

AM

Alex Molchanov in PHP DevConf
А вообще, парсинг дело неблагодарное в плане работы :) не говоря уже об этичности
источник

AM

Alex Molchanov in PHP DevConf
ФантомJS, точно
источник

ДР

Дмитрий Романов... in PHP DevConf
почему неблагодарное то?) просто нужно не на пхп это все делать
источник

AM

Alex Molchanov in PHP DevConf
Потому что
1. Требования большие
2. Может часто ломаться
3. Приходится писать много логики, что бы не ломало всё
4. При больших объемах данных нет возможности контролировать процесс и количество спарсенной информации
5. При этом клиент на каждую "неточность", может ебать мозг, вплоть до перепаршевания
источник

AM

Alex Molchanov in PHP DevConf
Помню как-то циан парсил 🤦🏽‍♂️ там вообще пагинация конченная была, объявления херпойми как дублировались, на сайте есть, в парсере нет, и копаешься потом в этом дерьме
источник

AM

Alex Molchanov in PHP DevConf
Или каспи товары, цены для истории собирал. Но тут себе. Потом нашел XML через гуголь, а они просто перестали обновлять :)
источник

AM

Alex Molchanov in PHP DevConf
Ещё приходилось парсить города и историю временных изменений. Там вообще пизда полная! И ещё клиент тяжёлый
источник

ДР

Дмитрий Романов... in PHP DevConf
ты просто используешь не те инструменты, я тебе как человек который промышленным масштабом парсинг делает говорю)
источник

AM

Alex Molchanov in PHP DevConf
Я думаю не от инструментов всё же зависит 😅 но ввязываться в спор не буду, выше описал проблему, которые не один инструмент не решит
источник

ДР

Дмитрий Романов... in PHP DevConf
даже результаты выдачи Гугла с его блоками по ацпи и капчами не сложно)
источник

L

Loot. in PHP DevConf
Ты в айдокторе что ли?
источник

ДР

Дмитрий Романов... in PHP DevConf
да
источник