Size: a a a

.NET Chat Убежище

2019 October 22

МХ

Макс Химик in .NET Chat Убежище
Всем привет. Такая проблема: для парсинга динамического сайта, наша компания использует в проектах c# элемент управления WebBrowser. С недавнего времени, во время исполнения цикла по переходу страниц, приложение с веббраузером крашится в случайном порядке. Прога может проработать и 5 минут, а может прекратить работу почти сразу. Настойчивое гугление почти ничем не помогло, за исключением того, что браузер использует ie7, и что это очень нехорошо. Читал, что каким-то макаром можно изменить версию браузера по умолчанию, но в реестре по указанной ветке стоит ie8. Может быть, кто-нибудь сталкивался с этой проблемой? Подскажите решение плз, чтобы браузер не вылетал.
источник

F

F. in .NET Chat Убежище
рекомендую глянуть в сторону HtmlAgilityPack и забыть о проблемах
источник

MD

Megatron Decepticon in .NET Chat Убежище
Макс Химик
Всем привет. Такая проблема: для парсинга динамического сайта, наша компания использует в проектах c# элемент управления WebBrowser. С недавнего времени, во время исполнения цикла по переходу страниц, приложение с веббраузером крашится в случайном порядке. Прога может проработать и 5 минут, а может прекратить работу почти сразу. Настойчивое гугление почти ничем не помогло, за исключением того, что браузер использует ie7, и что это очень нехорошо. Читал, что каким-то макаром можно изменить версию браузера по умолчанию, но в реестре по указанной ветке стоит ie8. Может быть, кто-нибудь сталкивался с этой проблемой? Подскажите решение плз, чтобы браузер не вылетал.
scraper который работает на htmlagilitypack. парсить будешь по xpath или queryselector
источник

MD

Megatron Decepticon in .NET Chat Убежище
Megatron Decepticon
scraper который работает на htmlagilitypack. парсить будешь по xpath или queryselector
и да, там можно указать useragent и прочие настройки
источник

V

Vabka in .NET Chat Убежище
F.
рекомендую глянуть в сторону HtmlAgilityPack и забыть о проблемах
вроде в сообщении сказано, что там динамический сайт. Значит там много чего на жс создаётся
источник

V

Vabka in .NET Chat Убежище
Макс Химик
Всем привет. Такая проблема: для парсинга динамического сайта, наша компания использует в проектах c# элемент управления WebBrowser. С недавнего времени, во время исполнения цикла по переходу страниц, приложение с веббраузером крашится в случайном порядке. Прога может проработать и 5 минут, а может прекратить работу почти сразу. Настойчивое гугление почти ничем не помогло, за исключением того, что браузер использует ie7, и что это очень нехорошо. Читал, что каким-то макаром можно изменить версию браузера по умолчанию, но в реестре по указанной ветке стоит ie8. Может быть, кто-нибудь сталкивался с этой проблемой? Подскажите решение плз, чтобы браузер не вылетал.
попробуйте перейти на webdriver или на puppeteer
источник

V

Vabka in .NET Chat Убежище
puppeteersharp вполне неплох, но по некоторым вещам уступает вебдрайверу
источник

MD

Megatron Decepticon in .NET Chat Убежище
источник

MD

Megatron Decepticon in .NET Chat Убежище
не знаю как там с парсингом, но можно допустим выполнять js в headless browser типа ultralight и парсить это позже при помощи htmlagilitypack
источник

МХ

Макс Химик in .NET Chat Убежище
Да там проблемка есть) парсим открытую инфу из росреестра, и ещё автоматически заказываем выписки. Скриптов выше крыши. Сам сайт написан чисто на джаве посредством vaadin, и для каждого поля ввода сначала загружается менюшка, а после выбора, значение отправляется на сервер динамически. Htmlagilitypack знаю такую, работаю с ней. Тут она не помощник, ибо на росреестре достаточно хитрая система аутентификации. Спасибо всем, посмотрю ссылки, чекну инфу
источник

EM

Endo 🐢 Morphine in .NET Chat Убежище
Макс Химик
Да там проблемка есть) парсим открытую инфу из росреестра, и ещё автоматически заказываем выписки. Скриптов выше крыши. Сам сайт написан чисто на джаве посредством vaadin, и для каждого поля ввода сначала загружается менюшка, а после выбора, значение отправляется на сервер динамически. Htmlagilitypack знаю такую, работаю с ней. Тут она не помощник, ибо на росреестре достаточно хитрая система аутентификации. Спасибо всем, посмотрю ссылки, чекну инфу
хедлесс браузер в помощь, выше ссылочку дали
источник
2019 October 25

МХ

Макс Химик in .NET Chat Убежище
Использовал Selenium chromedriver, остался очень доволен результатом) спасибо большое за совет про безголовые браузеры
источник

МХ

Макс Химик in .NET Chat Убежище
Особенно понравилась возможность сделать скриншот. Она решила проблему с капчой
источник
2019 October 26

DK

Denis Kuts in .NET Chat Убежище
Доброго времени суток, не могу въехать что делаю не так, ни одной ошибки нет, сама проверка рабочая, но BackgroundWorker не запускается, пробовал много чего.

https://gist.github.com/DeniskhanRG/50cf4d152c86ab400286b9d25b0a923a
источник

MD

Megatron Decepticon in .NET Chat Убежище
Denis Kuts
Доброго времени суток, не могу въехать что делаю не так, ни одной ошибки нет, сама проверка рабочая, но BackgroundWorker не запускается, пробовал много чего.

https://gist.github.com/DeniskhanRG/50cf4d152c86ab400286b9d25b0a923a
1. Рекомендую добавить трейсы в debug.writeline чтобы понимать что вообще происходит
2. RunWorkerAsync запускает воркера
источник

MD

Megatron Decepticon in .NET Chat Убежище
пример:
источник

MD

Megatron Decepticon in .NET Chat Убежище
источник

MD

Megatron Decepticon in .NET Chat Убежище
а вообще конечно надо на таски переходить и вот это все
источник

DK

Denis Kuts in .NET Chat Убежище
По поводу запуска уже узнал, но спасибо за ответ, а про задачи нужно прочитать. В общем спасибо!
источник
2019 October 27

DK

Denis Kuts in .NET Chat Убежище
Салам всем, совершенству нет предела, и свой код уже совершенствую, но вот сам еще не совершенен.

https://gist.github.com/DeniskhanRG/19d09aade558d388e5cb5cd4fbcb1776

Ругается что не в том потоке запускаю, кого куда в таком случае?
источник