Телеграмм чат группы datasciencecourse страница 4777

Здравствуйте! Посоветуйте пожалуйста курс чисто по Python хороший, можно и платный. С направлением анализ данных

Добрый день. Stepic Анатолий Карпов

08:43пожаловаться #1

Anton Rogozin in Machine learning

Программирование на Python

Есть несколько хороших курсов для изучения Python на Stepik (простым языком все объясняют):
- https://stepik.org/course/67 - Программирование на Python. Хороший курс для новичков
- https://stepik.org/course/58852/promo - "Поколение Python": курс для начинающих. Курс позиционируется для школьников

Stepik: online education

Курс посвящен базовым понятиям и элементам языка программирования Python (операторы, числовые и строковые переменные, списки, условия и циклы). Курс является вводным и наиболее подойдет слушателям, не имеющим опыта написания программ ни на одном из языков программирования.

Алина Коробчук... in Machine learning

08:55пожаловаться #2

АК

Спасибо!

09:07пожаловаться #3

K-S in Machine learning

Dmitry Penzar

Ну ее надо кроссвалидировать

Так SVC вы ж тоже кросс-валидируете. Просто в цикл cv добавить ещё логрег. Несильно на времени скажется

09:15пожаловаться #4

Dmitry Penzar in Machine learning

Можно, да, красиво. Нюанс будет только в том, что выберите модель лучшую по decision function, а использовать потом будете вероятности.

09:24пожаловаться #5

K-S in Machine learning

Да, но если изначальной метрикой был условной рок аук, то калибровка его не изменит

09:36пожаловаться #6

Dmitry Penzar in Machine learning

Да, согласен, преобразование монотонное

09:38пожаловаться #7

Dmitry in Machine learning

Если хочется прям с нуля получить неплохую базу, то могу посоветовать еще к курсам, что выше уже указали, "Инди-курс программирования на Python от egoroff_channel" на степике. Я сам начинал учить Python по его видео, потом он курс сделал. Правда некоторые видел доступны только по спонсорской подписке, но и без них можно

09:40пожаловаться #8

Гуттаг на курсере

10:18пожаловаться #9

igor

Гуттаг на курсере

EdX же

10:19пожаловаться #10

Может быть сории

10:19пожаловаться #11

https://www.edx.org/bio/john-guttag

10:19пожаловаться #12

это хорошие курсы, правда, класека

10:20пожаловаться #13

У него вышло третье издание книги расширенное питон для дс

10:20пожаловаться #14

5го января

10:20пожаловаться #15

Dmitry Penzar in Machine learning

igor

У него вышло третье издание книги расширенное питон для дс

как книга?

10:45пожаловаться #16

HelgMcRough in Machine learning

Valery

это хорошие курсы, правда, класека

Класе что ?

12:24пожаловаться #17

Классика)

12:26пожаловаться #18

kasov in Machine learning

Всем привет
Закончил первую неделю второго курса и решил написать что-то полезное для себя.
Есть "сет", состоящий из примерно 200 записей, которые содержат 6 признаков и 2 свойства, которые я хочу предсказывать
Первая проблема, с которой я столкнулся - без масштабирования X стохастический градиентный спуск после примерно 100 иттераций приходит к весам nan. Если сделать масштабирование признаков, тогда всё ок. Но вот получил я веса для отмасштабированного сета, хочу задать какие-то свои признаки и получить свойства, которые будут ожидаться - мне масштабировать признаки по какому среднему и среднеквадратичному отклонению? Правильно понимаю, что тут нужно использовать среднее и среднеквадратичное отклонение обучающей выборки? (Без масштабирования методом np.linalg.solve, кстати, более или менее похожее на правду предсказание выходит)
Ну и собственно вторая проблема или скорее вопрос. Как мне улучшить модель прогнозирования? У меня не все свойства имеют линейную зависимость. Сейчас начал ковырять полиномиальную регрессионную зависимость - я в правильном направлении двигаюсь?

17:50пожаловаться #19

Сколько данных, сколько столбцов?