Size: a a a

2020 April 04

И

Илья in Scrapy
В скрепи как то можно искать текст на странице и  получать xpath к нему.?
источник

AK

Anil Kumar in Scrapy
How to store files in ftp server having ssl connection using scrapy?
источник

AK

Anil Kumar in Scrapy
Anil Kumar
How to store files in ftp server having ssl connection using scrapy?
Anyone please reply
источник

B

Bulatbulat48 in Scrapy
Илья
В скрепи как то можно искать текст на странице и  получать xpath к нему.?
Xpath Contains
источник

АД

Антон Дорофеев in Scrapy
Vladyslav Babych
Актуальный вопрос какую БД вы используете для очень больших размеров данных?
Мне нравятся, mssql и pgsql, обе чудесно живут в высоконагруженных проектах, но зависит от настроек
источник

АД

Антон Дорофеев in Scrapy
Как собственно и прочии СУБД, зависит от потребностей
источник

АД

Антон Дорофеев in Scrapy
На mssql лично трогал терабайтную бд, но для своих использую постгрис, но очень важно правильно настроить из последних: ~100gb, на сервере 24гб озу, рейд из 8 винтов
источник

RG

Roman Gangal in Scrapy
Помогите пожалуйста разобраться с ошибкой. Есть список http проксей с авторизацией по логину и паролю.
Запускаю Scrapy на парсинг одного сайта. Первые 4 часа все пашет нормально. А потом тупо обрыв и сыпит подобные ошибки

Could not open CONNECT tunnel with proxy 78.131.40.66:30546 [{'status': 502, 'reason': b'Bad Gateway'}]

Could not open CONNECT tunnel with proxy 345.220.34.77:7654 [{'status': 407, 'reason': b'Proxy Authentication Required'}]

Но следует только перезапустить Scrapy наново, и все опять нормально пашет. все парсит через эти же прокси. Но опять через 4 часа сыпет подобные ошибки.
И так уже 3 сутки мучаюсь. перезапускаю, и не пойму в чем причина?
источник

iz

izzz zzi in Scrapy
Roman Gangal
Помогите пожалуйста разобраться с ошибкой. Есть список http проксей с авторизацией по логину и паролю.
Запускаю Scrapy на парсинг одного сайта. Первые 4 часа все пашет нормально. А потом тупо обрыв и сыпит подобные ошибки

Could not open CONNECT tunnel with proxy 78.131.40.66:30546 [{'status': 502, 'reason': b'Bad Gateway'}]

Could not open CONNECT tunnel with proxy 345.220.34.77:7654 [{'status': 407, 'reason': b'Proxy Authentication Required'}]

Но следует только перезапустить Scrapy наново, и все опять нормально пашет. все парсит через эти же прокси. Но опять через 4 часа сыпет подобные ошибки.
И так уже 3 сутки мучаюсь. перезапускаю, и не пойму в чем причина?
а что за прокси
источник

iz

izzz zzi in Scrapy
DOWNLOAD_DELAY - попробуй добавить
источник

RG

Roman Gangal in Scrapy
izzz zzi
а что за прокси
серверные от fineproxy . А на сколько порекомендуете сделатьDOWNLOAD_DELAY ?
источник

iz

izzz zzi in Scrapy
да ради интереса сделай 0.1-0.5
источник

iz

izzz zzi in Scrapy
Roman Gangal
серверные от fineproxy . А на сколько порекомендуете сделатьDOWNLOAD_DELAY ?
а там же привязка по ip вроде проксей?
источник

К

Кирилл in Scrapy
Я пробовал файн прокси, 5 приватных лучше отрабатывали, чем их 1000
источник

iz

izzz zzi in Scrapy
Кирилл
Я пробовал файн прокси, 5 приватных лучше отрабатывали, чем их 1000
Ну ты про их пакетные?
источник

RG

Roman Gangal in Scrapy
izzz zzi
да ради интереса сделай 0.1-0.5
ok) да по ip я и так и так пробовал, думал если с авторизацией сделать будет пахать. Но оно и без авторизации сыпет эти же ошибки
источник

К

Кирилл in Scrapy
izzz zzi
Ну ты про их пакетные?
Да
источник

И

Илья in Scrapy
rest.xpath('.//@href')[0].get()    если у элемента нету ссылок, то  выдает исключение. Есть какая то методика кроме try except ??
источник

RG

Roman Gangal in Scrapy
а кто-то запускал парсеры на хецнер клауде? может в нем дело?
источник

К

Кирилл in Scrapy
Илья
rest.xpath('.//@href')[0].get()    если у элемента нету ссылок, то  выдает исключение. Есть какая то методика кроме try except ??
Убрать [0]
источник