Size: a a a

Data Science Chat

2021 November 20

A

Andrey in Data Science Chat
yes) такое тоже может быть) ну вопрос конечно в том, как мониторить модели.

теорию мы всем знаем- по вторичным половым признакам. ну там, конверсия какая стала падать. но тому и 100500 причин может быть.
источник

SL

Sergey L in Data Science Chat
в контексте деньги, как метрики - не информативно, понятно, да, ток, как как серена для пожарников. Не уверен, что можно соорудить общую методу, ток скорее какие-то советы.

Как частное решение - мне в каком-то смысле нравилось, как в Тесле это делали. Но там проблема чуть легче, потому что без глубокого анализа классификация результатов доступна, ну т.е. сработало А, в ситуации Б или не сработало, например, водитель, подруливал ; маркировка - данные на обработку в пакетиках улетели.
удобно и в каком-то смысле граммотно, но степеней свободы в факторах меньше, чем в каком-нибудь "поведении спроса товара В на рынке Г", таки запаковать - можно, но не то, чтобы информативно
источник

k

keiDoom in Data Science Chat
Друзья. Пожалуйста, посоветуйте ресурс или книгу, по которой стоило бы учить SQL, учитывая что я знаком с Python, а мои склонности падают на Ai. Вероятно есть нюансы в изучении по разным книгам.
источник

A

Andrey in Data Science Chat
это если есть статистика по негативным случаям. а вот если 2 хороших 1 плохой... понятно A/B, понятно там есть всякие Бабушкинские методы.

но уже прод. я вижу прогноз врёт. а потом не врёт. а потом опять врёт  а потом нет.

Байес только ли выручать должен? нет ни у кого столько веры в метаматан.

Вот и выходит, что начальное нужно данных так, и метрик так, чтобы уж и ошибка бизнес устраивала
источник

A

Andrey in Data Science Chat
sql это два подмножества. Data definition language, создать таблицу, удалить колонку..  и data manipulation language. выборки, добавить строку, изменить строки...

дата саентисту интересен только select, и изучить все его ипостаси можно за неделю где-то.

хотя штука и мощная, может чуть больше чем половину pandas.

в итоге загляните в википедию, оттуда можно найти куда продолжать разбираться
источник

В

Вадим in Data Science Chat
Вот это да. У вас на работе саентисты только селектят ?
источник

A

Andrey in Data Science Chat
есть специально обученные люди на остальной sql. удивляет ?)
источник

k

keiDoom in Data Science Chat
У меня сейчас стоит вопрос: С моим уклоном в Ai, мне нужно учить PostgreSQL , или MySQL. Как я это понимаю, майскл больше для веба нужнее, а постгре для сложных аналитических возможностей
источник

A

Andrey in Data Science Chat
один хрен с вариациями. все можно и для веба, и для ds
источник

В

Вадим in Data Science Chat
Так нахер кому такие саентисты нужны ?
источник

A

Andrey in Data Science Chat
sql это не привязанный (в изначальной концепции) к реализации db язык
источник

A

Andrey in Data Science Chat
ну так это и не саентисты. это dba
источник

V

Vlad in Data Science Chat
Есть вроде сайтики какие-то со всякими разными задачами, там можн попробовать
источник

SL

Sergey L in Data Science Chat
в обобщенном смысле так и есть, да. Вопрос даж не в матане/подходах, а в количестве ресурсов и задержках на реакцию и отклик, как и везде.
Ну и в релевантности в создании/автоматизации вообще в принципе.
Но, когда вишенка на торте есть, поприятнее, конечно

Не уверен, что вообще есть смысл даж думать в сторону обобщающего подхода, если только для каких-то схожих задач. При небольшой смене окружения - все слетит, либо упрется в теже данные, которые, хорошо, если за пару дней наскребуться, а не пару мес/лет, скажем😁
источник

k

keiDoom in Data Science Chat
Да я слышал про sql-ex
источник

k

keiDoom in Data Science Chat
Мне нужна в итоге книга, которая поможет понять теорию баз данных. Оттуда уже думаю можно опираться на вариации.
источник

k

keiDoom in Data Science Chat
Я так понял это всё
источник

В

Вадим in Data Science Chat
Тебе не нужна теория баз данных. Выучи сиквел, посмотри что такое индексы, эксплейн, чем олап от олтп отличается
источник

В

Вадим in Data Science Chat
На все про все уйдёт неделя - две максимум
источник

SL

Sergey L in Data Science Chat
+

Для того, что данные забирать или закидывать, теория баз данных - потраченное время, если ток ради любопытства для общего развития посмотреть.
Если ток не придется оптимизацией заниматься и прочим в сторону уже программирования/инженерии/архитектурное проектировние, конечно
источник