Size: a a a

Python для анализа данных

2019 August 14

R

Roman in Python для анализа данных
Ну то есть сами создатели также пишут) спасибо)
источник

M

Mikh in Python для анализа данных
#help
Помогите, не нашел в гуглах ответа, как подгрузить данные в датафрейм проигнорировав первые строчки текста. Google Query Explorer выдает отчет из google analytics в формате .TSV и перед заголовком таблицы идет описание(см.скриншот). В итоге помогло ручное удаление первых строк, что бы остались только табличные данные а заголовки столбцов были первой строкой, но должно же быть какое то решение кодом. Если просто загрузить таблицу через read_csv выдает ошибку UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte. Ручная перекодировка не помогает, только удаление этих строк описания
источник

А

Алексей in Python для анализа данных
Mikh
#help
Помогите, не нашел в гуглах ответа, как подгрузить данные в датафрейм проигнорировав первые строчки текста. Google Query Explorer выдает отчет из google analytics в формате .TSV и перед заголовком таблицы идет описание(см.скриншот). В итоге помогло ручное удаление первых строк, что бы остались только табличные данные а заголовки столбцов были первой строкой, но должно же быть какое то решение кодом. Если просто загрузить таблицу через read_csv выдает ошибку UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte. Ручная перекодировка не помогает, только удаление этих строк описания
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Mikh
#help
Помогите, не нашел в гуглах ответа, как подгрузить данные в датафрейм проигнорировав первые строчки текста. Google Query Explorer выдает отчет из google analytics в формате .TSV и перед заголовком таблицы идет описание(см.скриншот). В итоге помогло ручное удаление первых строк, что бы остались только табличные данные а заголовки столбцов были первой строкой, но должно же быть какое то решение кодом. Если просто загрузить таблицу через read_csv выдает ошибку UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte. Ручная перекодировка не помогает, только удаление этих строк описания
А зачем с Query Explore данные собирать, а не напрямую с GA ?
источник

M

Mikh in Python для анализа данных
Спасибо, но это подходит только если открыть вручную файл и посчитать сколько строк пропустить надо. А я имею ввиду автоматическую проверку, если данные не табличные, не подходящие то пропуск и проверка следующей строки, что бы таким образом он скрипт до заголовка дошел и дальше импорт сделал
источник

M

Mikh in Python для анализа данных
Владислав Литвинюк
А зачем с Query Explore данные собирать, а не напрямую с GA ?
Нужно один отчет большой почистить и пересобрать. А напрямую пока не знаю как сделать
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Mikh
Нужно один отчет большой почистить и пересобрать. А напрямую пока не знаю как сделать
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Mikh
Нужно один отчет большой почистить и пересобрать. А напрямую пока не знаю как сделать
также есть разширения для автомат импорта с GA в гугл щитс
источник

M

Mikh in Python для анализа данных
это бесплатными средствами или всякие гуглБигЙвери, Рента и тд по подписке?
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Mikh
это бесплатными средствами или всякие гуглБигЙвери, Рента и тд по подписке?
фри
источник

M

Mikh in Python для анализа данных
Спасибо изучу
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Нашёл прикольную функцию для выбросов)
https://docs.astropy.org/en/stable/api/astropy.stats.sigma_clip.html
источник
2019 August 15

AM

Alexey Martynov in Python для анализа данных
Всем доброе утро) Ребята подскажите как можно округлитьвверх значения в столбце. У меня в голове пока с помощью цикла и math.ceil(), но может быть есть и проще способ )
источник

M

Mikh in Python для анализа данных
Alexey Martynov
Всем доброе утро) Ребята подскажите как можно округлитьвверх значения в столбце. У меня в голове пока с помощью цикла и math.ceil(), но может быть есть и проще способ )
Доброе. В нампай есть такой способ:

numpy.ceil(x, *ufunc_args) = <ufunc 'ceil'>
Функция ceil() округляет к большему целому числу. Данная функция часто называется потолок числа x и обозначается как ⌈x⌉.

https://pyprog.pro/mathematical_functions/ceil.html
источник

M

Mikh in Python для анализа данных
Alexey Martynov
Всем доброе утро) Ребята подскажите как можно округлитьвверх значения в столбце. У меня в голове пока с помощью цикла и math.ceil(), но может быть есть и проще способ )
перейдя по ссылке, справа на странице найдете другие мат функции этой библиотеки
источник

AM

Alexey Martynov in Python для анализа данных
Спасибо!)
источник

AM

Alexey Martynov in Python для анализа данных
получилось
источник

НД

Новиков Дмитрий... in Python для анализа данных
Всем привет, подскажите как без рекурсии можно сделать колонку с числовыми признаками от 1 до 10 и чтобы цифры постоянно повторялись? 1-10, 1-10
источник

M🌗

M 🌗🌘🌑🌒🌓... in Python для анализа данных
Новиков Дмитрий
Всем привет, подскажите как без рекурсии можно сделать колонку с числовыми признаками от 1 до 10 и чтобы цифры постоянно повторялись? 1-10, 1-10
я не совсем понимаю, но range(0, 1)
источник

M🌗

M 🌗🌘🌑🌒🌓... in Python для анализа данных
или numpy.arange(1, 11)
источник