Size: a a a

Python для анализа данных

2019 August 20

ИО

Иван Оболенский... in Python для анализа данных
все отработает на ура
источник

DS

Dmitriy Shashkin in Python для анализа данных
Да, к утру
источник

ИО

Иван Оболенский... in Python для анализа данных
не согласен
источник

DS

Dmitriy Shashkin in Python для анализа данных
Ок. Но я точно знаю что производительность в таком случае на несколько порядков ниже
источник

DS

Dmitriy Shashkin in Python для анализа данных
Там много причин: и время на разбор каждого запроса и то что, например, индексы нужно перестраивать после каждого запроса
источник

DS

Dmitriy Shashkin in Python для анализа данных
На тысяче записей это всё не очень критично, но вставке нескольких миллионов строк это разница на порядки
источник

ИО

Иван Оболенский... in Python для анализа данных
я честно не берусь спорить, поскольку у нас на работе все процессы реализуются по-возможности на уровне БД, чтобы исключить ситуацию, что сначала мы что-то должны обработать или получить на стороне. Но последний раз проблем с вставкой не было, при этом обьемы были очень большие.
источник

ИО

Иван Оболенский... in Python для анализа данных
ну и бд у нас не MySQL
источник

DS

Dmitriy Shashkin in Python для анализа данных
возможно в этом всё дело)
источник

ИО

Иван Оболенский... in Python для анализа данных
Dmitriy Shashkin
возможно в этом всё дело)
Пообщались тут с коллегами... БД какая?
источник

DS

Dmitriy Shashkin in Python для анализа данных
Иван Оболенский
Пообщались тут с коллегами... БД какая?
Mysql, myisam
источник

ИО

Иван Оболенский... in Python для анализа данных
Dmitriy Shashkin
Mysql, myisam
Грузите через gui или load data infile... ?
источник

ИО

Иван Оболенский... in Python для анализа данных
У нас была похожая проблема со справочником недействительных паспортов. И мы игрались с настройками разделителей
источник

ИО

Иван Оболенский... in Python для анализа данных
источник

DS

Dmitriy Shashkin in Python для анализа данных
Через  load data infile
источник

DS

Dmitriy Shashkin in Python для анализа данных
Там вариантов особых не вижу. Можно ESCAPED BY поставить пустым, но тогда mysql неправильно воспринимает /n (null)
источник

DS

Dmitriy Shashkin in Python для анализа данных
Реально проблема не ограничена mysql, даже когда из python пишешь в csv а потом считываешь обрабтно - получаются другие данные
источник

DS

Dmitriy Shashkin in Python для анализа данных
источник

ИО

Иван Оболенский... in Python для анализа данных
Dmitriy Shashkin
Реально проблема не ограничена mysql, даже когда из python пишешь в csv а потом считываешь обрабтно - получаются другие данные
Это да. Но вариантов у вас не так много.
источник
2019 August 21

P

Peter in Python для анализа данных
ребят, не могу придумать как посчитать количество сессий с поиском, есть отдельно события по сессиям и поискам, таймштампы для поиска и таймпштамп для начала и конца сесии. Может быть кто-то сталкивался с такой задачей?
источник