Size: a a a

Data Science Chat

2021 December 03

D

Dima in Data Science Chat
Тогда интервал изменения медианы будет  определен последней парой
источник

a

aur in Data Science Chat
Ужс
источник

В

Виталий in Data Science Chat
источник

A

Andrey in Data Science Chat
нормальную ссылку дай пожалуйста
источник

В

Виталий in Data Science Chat
источник

DS

Denis Stadnik in Data Science Chat
может кто-то видел соревнования на kaggle по предсказыванию нагрузки на сервер ?
источник

M

Misha in Data Science Chat
Кто разбирается в pandas-profiling? У меня нормально делает отчет с датасетом Бостона, но в моем датасете ничего не показывает to_notebook_iframe. Если делать в html не отрисовываются зависимости. Пробовал даже перегнать датафрейм в массив numpy, а потом обратно в df с нужными колнками. Что может быть не так с моей csv'шкой? помогите, пожалуйста
источник

M

Misha in Data Science Chat
ещё и жрет всю оперативу, что есть, вообще без понятия почему так) отчет по 1000 сэмплов 5 гб оперативы забирает и всё равно не показывает ни зависимости, ни корреляцию. никто не сталкивался?
источник

JT

Jack Torrance in Data Science Chat
Привет ребята!
Есть такие, кто работает джуном и параллельно учится (бакалавриат, магистратура)?
Напишите пожалуйста в лс
источник

TM

Tony Montana in Data Science Chat
Приветствую! Такой вопрос - где наиболее обстоятельно можно разобраться с функцией распределения?
источник
2021 December 04

k

keiDoom in Data Science Chat
Мне как-то один знакомый, с огромным опытом дс, сказал -«Чтобы научиться рисовать художнику, ему нужен карандаш, ластик и лист. А чтобы воплощать шедевры в реальность - все остальные инструменты.» Если провести аналогию, то тебе не нужна  сразу вся математика. Учитывай,  что на первых этапах ты изучаешь язык программирования, простые алгоритмы и работу с БД, а только потом приступаешь к математике. Как только дойдёшь до первых шагов в ML, тогда уже нужна будет математика, чтобы понять о чем идёт речь в документации как минимум.
Опять же, возвращаясь к первым словам - тебе нужны все инструменты, чтобы научиться видеть конечный продукт, если ты ожидаешь что-то крутое и прогрессивное.
источник

DA

Daniil Agniashvili in Data Science Chat
https://awesomeopensource.com/projects/similarity-search
тут их много, какие-нибудь уже ставил?
milvus у меня не ставится, ибо cmake старый на дебиане(
источник

A

Andrey in Data Science Chat
тут какая петрушка... и вроде он прав... который сказал "а чтобы воплощать в реальность - все остальные инструменты". только вот эти "остальные" инструменты, это не знание huggingface, opencv, pytorch, фишек python3.9 или же теории вероятностей,  матстатистики, теории гомотопий или чего-то еще...

интуиция нужна имхо. если примитивно - почему-то никто не бахает бустами картинки/тексты? зря? нет? бусты ж блин теоретически сходятся?

если не так примитивно. функцию ошибки потряхивает так как под капотом процесса генерации данных есть случайные шумы? уменьшай lr.

мысль скорее такая - нужно больше читать (arxiv тот же) и экспериментировать с записями хоть в блокнотике, и изучать хорошо сами данные (типы), с которыми работаешь.

я без претензий на гуру, просто субботние соображения
источник

k

keiDoom in Data Science Chat
Да ты прав !
источник

DZ

Daniel Zaharov in Data Science Chat
Друзья, привет. Подскажите, пожалуйста, есть тут люди, кто работал с dask массивами в hdf файлах. Подскажите, пожалуйста, как правильно считать такой файл? Гугл что-то путного ничего не выдает, только про загрузку
источник

DA

Daniil Agniashvili in Data Science Chat
Всем привет! кто-нибудь юзал imgsmlr? насколько он удобен?
Я хочу сформировать датасет из авитошных фотографий недвижимости, примерно по несколько млн фотографий будет предполагается. Хоть и есть свободный 1ТБ на сервере
по сути, было бы круто найти какой-то similarity search engines, в котором не нужно хранить сами фотографии, а только их хеш
источник

N🙃

Nick 🙃 in Data Science Chat
Добрый вечер! Помогите, пжлста с pandas
Есть колонка с именами и фамилиями.
Нужно разделить-сделать две колонки в одной имя/ в другой фамилия.

Типовая вроде задача, но у меня не выходит
источник

BS

Boris Sirotin in Data Science Chat
почему же не получается?
источник

N🙃

Nick 🙃 in Data Science Chat
Не пойму что использовать
источник

BS

Boris Sirotin in Data Science Chat
покажите хотябы колонку эту
источник