Size: a a a

Python для анализа данных

2021 September 14

IS

Ilya Shutov in Python для анализа данных
не надо смешивать понимание количественных показателей входных данных с тормознутостью выбранных способов загрузки
источник

S

Somebody in Python для анализа данных
Действительно
источник

S

Somebody in Python для анализа данных
А то они не связаны
источник

IS

Ilya Shutov in Python для анализа данных
для DS это пустой разговор.
шарьте файл, код и свой тайминг
источник

S

Somebody in Python для анализа данных
Ага, разбежался
источник

IS

Ilya Shutov in Python для анализа данных
скучный вопрос...
полное отсутствие численных оценок

в таком случае достаточно тогда открыть в notepad++ (если винда) и посмотреть число строк.
источник

S

Somebody in Python для анализа данных
Мне больше нравится метод, который предложили выше
источник

S

Somebody in Python для анализа данных
И код с данными шарить не надо, нарушая все законы
источник

aa

artem a in Python для анализа данных
Написал тут код и чет подумал, чем бы вы заменили это извращение?

res['natural_index']=res.apply(lambda q: ''.join(map(lambda w: str(coalesce(q[w],'')),'col1 col2 col3'.split())),axis=1)
источник

VM

Valerii Mamontov in Python для анализа данных
У меня был такой случай.
7 млн. строк. Выгрузка постов из Твиттера. Один столбец содержал текст (сам пост), который сильно грузил систему и она падала от "out of memory".
Чтобы решить задачу пришлось читать файл построчно и работать с каждой строкой.

Если в Ваших данных есть текст, то это может объяснить такое длительное время загрузки данных в DataFrame.
источник

S

Somebody in Python для анализа данных
Ммм однако
Спасибо
источник

VM

Valerii Mamontov in Python для анализа данных
Или у вас "грязные" данные. Тогда pandas не сможет корректно преобразовать столбцы к нужным типам данных. В итоге все столбцы в Вашем DataFrame будут иметь тип "object".
"123456783948" - будет не int, а object.
Наличие большого количества NaN (пропусков) может дать похожий эффект.
источник

IS

Ilya Shutov in Python для анализа данных
Валерий, Вы просто пример идеального преподавателя!
Кейсов, действительно, может быть миллион разных.
И схемы загрузки тоже радикально отличаются по скорости (apache arrow !!).

К сожалению, без примера данных, все это только догадки, а проблема может скрываться в совсем ином месте.
источник

VM

Valerii Mamontov in Python для анализа данных
Размышляю в условиях неопределенности))
Думаю, до преподавания мне очень далеко, так как я сам только в начале пути)

Согласен с Вами, Илья)
Небольшой срез данных многое бы объяснил и позволил найти лучшее решение.
источник

N

Nick in Python для анализа данных
Добрый день! Спасибо за активное участие в опросе! Он показал, что треть участников в поисках.

Мы с коллегами пилим систему трудоустройства по рекомендациям. Идея в том, что работодатели доверяют рекомендациям больше, чем резюме, а значит порекомендованные люди получают больший шанс найти работу. Сейчас ищем добровольцев из тех, кто не против рассмотреть предложения о работе, чтобы быть порекомендованными и рассказать об опыте.

Если кому-то интересно - пожалуйста, напишите в личку.
источник

АД

Андрей Демидов... in Python для анализа данных
А кто эти рекомендации давать по сотрудникам давать будет?
источник

N

Nick in Python для анализа данных
Изначально мы целимся на ВУЗы - там кураторы или кто-то из отдела трудоустройства учебного заведения. Но ВУЗы все оооочень медленные ("Наталья Петровна в отпуске, напишите в конце ноября" и тд и тп).  Так что на время эксперимента вот сами добровольцев ищем по чатам-форумам.
К стати, если у кого-то есть выходы на ВУЗы РФ и СНГ - буду крайне признателен за помощь в выходе с ними на контакт. Извините, не даю ссылок, так как опасаюсь правила нарушить, если придет админ и разрешит - поделюсь конечно же деталями :)
источник

ВС

Виктор Суносов... in Python для анализа данных
Всем привет, подскажите пожалуйста, как сделать что бы кнопка была без ТЕКСТА сверзу? (Что бы после картинки была только кнопка и все) как бы не старался, ничего не получается
источник

ВС

Виктор Суносов... in Python для анализа данных
источник

SS

Sergey Svetlov in Python для анализа данных
А последнюю месагу если убрать?
источник