Size: a a a

Python для анализа данных

2019 August 23

VS

Vanya Slobodchikov in Python для анализа данных
вон там чувак просто наделал их и меняет))
источник

D

Daria Alexeenko in Python для анализа данных
динамическая смена прокси-адресов и юзерагентов
источник

D

Daria Alexeenko in Python для анализа данных
и количество rps от тебя скорее всего нечеловеческое
источник

IS

I Sh in Python для анализа данных
Новиков Дмитрий
Всем привет! Подскажите как лучше парсить сайты, когда они отдают код 200, но при этом тело документа пустое например http://prntscr.com/owklyh в примере озон.РУ . Хедер отдаю и иногда получается получить документ, но в большинстве случаев результат пустой
На скриншоте дана ссылка на ифрейм, попробовать сначала к нему напрямую обратиться. Потом посмотреть, что делает ява-скрипт, может, всё надо парсить Селениумом.
источник

НД

Новиков Дмитрий... in Python для анализа данных
Есть библиотека Фейк Юзер Агент. Спасибо почитаю, но мне не только озон Нужен, к примеру 100000 сайтов и получается везде где нет ответа, нужно всегда менять юзер агент
источник

НД

Новиков Дмитрий... in Python для анализа данных
I Sh
На скриншоте дана ссылка на ифрейм, попробовать сначала к нему напрямую обратиться. Потом посмотреть, что делает ява-скрипт, может, всё надо парсить Селениумом.
Я напрямую обращаюсь, и каждый 5 раз я получаю документ.
источник

IS

I Sh in Python для анализа данных
Напрямую к iframe?
источник

НД

Новиков Дмитрий... in Python для анализа данных
http://prntscr.com/owktg4
user_agent = UserAgent().chrome
print(user_agent)
headers = {'User-Agent': user_agent}
link = 'https://www.ozon.ru/highlight/24178/'
url = requests.get(link.strip(), timeout=120, verify=False, headers = headers)
url_html = BeautifulSoup(url.text, 'html.parser')
status = url.status_code
print(status)
print(url_html)
источник

IS

I Sh in Python для анализа данных
вот теперь body пустой. Наверн, сервер понял, что это не человек. Надо немного подождать, обратиться ещё раз, получить ответ с ифреймом, получить этот ифрейм, и его уже распарсить.
источник

IS

I Sh in Python для анализа данных
Ну и, конечно же, смотреть ява-скрипты. Может, он всё через аякс подгружает - тогда какой юзер-агент ни поставишь, контент не получить...
источник

НД

Новиков Дмитрий... in Python для анализа данных
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Спасибо, похоже на то.
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Хочу сконектиться к api google analytics через инструкцию
https://nbviewer.jupyter.org/urls/drive.google.com/uc/%3Fid=16X5S7bwcNyxCLczIvx-FXggZvky6NCF8&authuser=0&export=download
Но во время создания переменной gam. Выдает такую ошибку:
UnknownApiNameOrVersion: name: analytics  version: v4

Способ коннекта: с помощью клиентского токена
Скрин кода приложен

Скажите, пж, что делать?
источник

OO

Oleg Omelchenko in Python для анализа данных
"analyticsreporting"
источник

OO

Oleg Omelchenko in Python для анализа данных
вместо analytics
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Oleg Omelchenko
"analyticsreporting"
спасибо!
источник

OO

Oleg Omelchenko in Python для анализа данных
Если через сервис-аккаунт подключаетесь, рекомендую протестировать эту либу: https://github.com/gaapi4py/gaapi4py
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Oleg Omelchenko
Если через сервис-аккаунт подключаетесь, рекомендую протестировать эту либу: https://github.com/gaapi4py/gaapi4py
спасибо, попробую
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Oleg Omelchenko
Если через сервис-аккаунт подключаетесь, рекомендую протестировать эту либу: https://github.com/gaapi4py/gaapi4py
в том же ноутбуке есть сервис аккаунт, сейчас нужно сделать быстро, а так, конечно лучше через сервис-аккаунт
источник
2019 August 25

ВЛ

Владислав Литвинюк... in Python для анализа данных
Привет, скажите, пж, почему не могу построить plt.boxplot?
fig, ax = plt.subplots(dpi = 100)
plt.figure(figsize=(2, 3))
ax.boxplot(df.close)
plt.show()
источник