Size: a a a

ML Boot Camp Official

2021 February 24

ДВ

Дима Васькин... in ML Boot Camp Official
Stanislav Demchenko
как только дипломы из маде довезут, так сразу будут 😈😁
Значит без активностей😁
источник

JS

Jury Sergeev in ML Boot Camp Official
у кого нибудь есть датасет каггловский Титаник, но весь размеченный?
источник

JS

Jury Sergeev in ML Boot Camp Official
пепе есть у тебя датасет Титаник с каггла?
источник

p

pepeground_bot in ML Boot Camp Official
тебя не совпадает наверное с реальным? у тебя на аве.
источник

RY

Ruslan515 Y in ML Boot Camp Official
Всем привет! Нужна консультация или ссылка на статью. В данный момент используем  cassandra. Данные хранятся за весь промежуток времени. Для оперативной с БД использую kibana ( но данные не за весь период). Мне нужно фильтрануть данные за весь период. В данный момент для этого я выгружаю данные из cassandra затем произвожу манипуляции. Проблема в том, что выгрузка идет часами. Если более корректно сформулировать вопрос:  как работать с cassandra делая запросы "на лету"с фильтрами?
источник

JS

Jury Sergeev in ML Boot Camp Official
Начать использовать кликхаус?
источник

JS

Jury Sergeev in ML Boot Camp Official
А если серьёзно - у кассандры есть фильтрация на стороне сервера
источник

JS

Jury Sergeev in ML Boot Camp Official
Но не бесплатно, с точки зрения усилий)
источник

RY

Ruslan515 Y in ML Boot Camp Official
сорян, если глупый вопрос. как из csv прочитать строки с определенным индексом? файл большой, в память не лезет. я знаю индексы, и мне нужны именно эти строки
источник

Р

Роман in ML Boot Camp Official
Ruslan515 Y
сорян, если глупый вопрос. как из csv прочитать строки с определенным индексом? файл большой, в память не лезет. я знаю индексы, и мне нужны именно эти строки
Использовать Dask или читать чанками.
источник

RY

Ruslan515 Y in ML Boot Camp Official
Jury Sergeev
Начать использовать кликхаус?
уже 2й чел говорит об этом)
источник

RY

Ruslan515 Y in ML Boot Camp Official
Роман
Использовать Dask или читать чанками.
походу чанками самый простой способ)
источник

Р

Роман in ML Boot Camp Official
Ruslan515 Y
походу чанками самый простой способ)
При опыте работы с Пандас - да.
источник

JS

Jury Sergeev in ML Boot Camp Official
да пусть сама касандра фильтрует
источник

JS

Jury Sergeev in ML Boot Camp Official
всяко быстрее чем тянуть столько данных куда-то
источник

JS

Jury Sergeev in ML Boot Camp Official
а если чанками - то параллельно из разных шард-ов, если они есть
источник

JS

Jury Sergeev in ML Boot Camp Official
Jury Sergeev
у кого нибудь есть датасет каггловский Титаник, но весь размеченный?
сам нашел, все топовые топы на Титанике юзают уже предсказанный кем-то тест, при этом прям EDA делают, и прям модельки обучают )) а по факту суют эти предсказания, ну вот нафигэтовсе
источник

М

Миша in ML Boot Camp Official
Jury Sergeev
сам нашел, все топовые топы на Титанике юзают уже предсказанный кем-то тест, при этом прям EDA делают, и прям модельки обучают )) а по факту суют эти предсказания, ну вот нафигэтовсе
Просто титаник — это не очень интересно, он давно изучен и хорошие метрики на нём получить легко
В качестве обучения — да, неплохо, но соревноваться на нём смысла нет)
источник

JS

Jury Sergeev in ML Boot Camp Official
Миша
Просто титаник — это не очень интересно, он давно изучен и хорошие метрики на нём получить легко
В качестве обучения — да, неплохо, но соревноваться на нём смысла нет)
Я не о том, там просто предикты выложены на единицу) и все их используют, польза то какая
источник
2021 February 25

A

Artem in ML Boot Camp Official
знает ли кто-то как из одного Azure Databricks workspace перенести Hive таблицу в другой Azure Databricks workspace  ?
источник