Size: a a a

Python для анализа данных

2019 July 16

A

Andrey Denisov in Python для анализа данных
Спасибо
источник

E

Elenka in Python для анализа данных
Andrey Denisov
Ну вот как раз с функцией-то всё понятно. Возможно, есть механизм отлова при получении данных - до их вставки куда бы то ни было
if else хаххаха
источник

dd

dgj dfsh in Python для анализа данных
Andrey Denisov
Спасибо
отпишитесь потом как что там, если будете ее использовать
источник

A

Andrey Denisov in Python для анализа данных
Ок
источник

E

Elenka in Python для анализа данных
просто не знаю зачем тут усложнять, если вопрос просто в том, прилетает ли нужный тип данных)
источник

A

Andrey Denisov in Python для анализа данных
В 3 колонках, условно, должны быть числа, но когда-то прилетают буквы. Или NULL. Или ещё что.
источник

YP

Yuriy Prudnikov in Python для анализа данных
Как много данных прилетает и как быстро их надо обрабатывать?
источник

A

Andrey Denisov in Python для анализа данных
100К строк, почистисть и вставить в mysql. Вопрос автоматизации чистки.
источник

АМ

Алексей Макаров... in Python для анализа данных
Если вы используете датафрейм, то тип колонки сразу же будет object, если вам прилетает среди int хотя бы одна строка. Найти значения в этой колонке, которые являются числами можно с помощью str.isnumeric. Как только нашли строки, чем loc можно сделать реплейс на какое-то число по умолчанию. Либо удалить строки.

А с null срабывать просто, в pandas есть fillna или dropna. В зависимости от того, что хочется
источник

A

Andrey Denisov in Python для анализа данных
Беда в том, что непонятно что прилетит. Исторические данные можно перелопатить функцией - и новые менять по аналогии.
Удалять - не вариант, надо менять по шаблону. Вот по этому шаблону и возник вопрос. Поковыряю https://github.com/rhiever/datacleaner
источник

E

Elenka in Python для анализа данных
Andrey Denisov
Беда в том, что непонятно что прилетит. Исторические данные можно перелопатить функцией - и новые менять по аналогии.
Удалять - не вариант, надо менять по шаблону. Вот по этому шаблону и возник вопрос. Поковыряю https://github.com/rhiever/datacleaner
Всмысле? Вы точно знаете, что должно быть число. Любой другой вариант в виде NULL, строки и т.д однозначно не подходит, так?
источник

A

Andrey Denisov in Python для анализа данных
Так
источник

A

Andrey Denisov in Python для анализа данных
Просто аналогично нужно сделать и для других типов данных. У меня не хватает скилла предусмотреть все варианты.
источник

E

Elenka in Python для анализа данных
Andrey Denisov
Просто аналогично нужно сделать и для других типов данных. У меня не хватает скилла предусмотреть все варианты.
А их не так много будет
Вам нужно предусмотреть не тот тип данных и пропущенное значение)
источник

E

Elenka in Python для анализа данных
Andrey Denisov
Беда в том, что непонятно что прилетит. Исторические данные можно перелопатить функцией - и новые менять по аналогии.
Удалять - не вариант, надо менять по шаблону. Вот по этому шаблону и возник вопрос. Поковыряю https://github.com/rhiever/datacleaner
ааа до меня толькл дошло. Если число, то ок, если строка то обрезать по какому то шаблону ее? а если null?
источник

E

Elenka in Python для анализа данных
Из вас клещами вытягивать детали надо😂
источник

A

Andrey Denisov in Python для анализа данных
😐
источник

ФК

Фархад Керимли... in Python для анализа данных
блин, вроде бы
1.простой fillna(0) для nan строк
2.простой Series.str.isnumeric() в качестве условия. Если false, то дропать строку или заменять на 0 лямбдой
источник

ФК

Фархад Керимли... in Python для анализа данных
ну еще можно проверить пустое значение, а не Null
источник

ФК

Фархад Керимли... in Python для анализа данных
той же лямбдой
источник