Size: a a a

Machine learning

2020 May 06

М

Мира 💫 in Machine learning
Аселя
Если у меня уже была установлена последняя версия питона, это и вызывает ошибку?
Скорее всего, происходит конфликт версий питона
Но тяжело сказать прям точно, нужно смотреть, я не знаю, что вы нажимали при установке (какие галочки) и была ли ошибка при установке
Если будете удалять питон - не забудьте убрать из appdata(скрытая папка), актуально для вин
источник

V

Valery in Machine learning
Всем привет! Составляю резюме на позицию Jr DS, прошу совета по оформлению у более опытных товарищей.
Вопрос: В каком формате лучше отразить опыт и знания полученные при прохождении данного курса?

Интересные практические задания и проекты я закинул на github и указал ссылку на него, а вот стоит ли расписывать более подробно про знания
случайных процессов, методов оптимизации, моделей и алгоритмов машинного обучения, способов борьбы с переобучением, кросс-валидации, тематического моделирования и т.п.  Или стоит просто написать что- то наподобие:
- Знания математической статистики и теории вероятности
- Понимания основных принципов и алгоритмов машинного обучения
и т.п. более общие формулировки?
источник

V

Vladislav-kun in Machine learning
Участие в соревнованиях я так понимаю это очень жирный плюс
источник

AU

A U in Machine learning
Всем привет. Может кто-нибудь объяснить зачем делить выборку на train и test, если на выборке train мы потом делаем кросс-валидацию без подбора гиперпараметров? Почему нельзя сразу всю имеющуюся выборку отдать в кросс-валидацию?

Пример из C6W4:

X_train, X_valid, y_train, y_valid = train_test_split(X, y, test_size=0.3)

knn = KNeighborsClassifier(n_neighbors=100, n_jobs=-1)

score = cross_val_score(knn, X_train, y_train, cv=skf)

Зачем здесь делаем train_test_split мне не понятно.
источник

K

K-S in Machine learning
Valery
Всем привет! Составляю резюме на позицию Jr DS, прошу совета по оформлению у более опытных товарищей.
Вопрос: В каком формате лучше отразить опыт и знания полученные при прохождении данного курса?

Интересные практические задания и проекты я закинул на github и указал ссылку на него, а вот стоит ли расписывать более подробно про знания
случайных процессов, методов оптимизации, моделей и алгоритмов машинного обучения, способов борьбы с переобучением, кросс-валидации, тематического моделирования и т.п.  Или стоит просто написать что- то наподобие:
- Знания математической статистики и теории вероятности
- Понимания основных принципов и алгоритмов машинного обучения
и т.п. более общие формулировки?
1) гитхаб — это хорошо. Постарайся его наполнить чем-то посущественнее обычных домашек с курсов, конечно. Лучше всего прорешать парочку соревнований (необязательно активных в данный момент) и закинь код в гит. Это проще, чем делать свой петпроджект, поскольку данные за тебя уже собраны и при этом это все таки решение полноценной задачи от и до в отличии от обычных домашек

2) в детали а-ля знаешь чем адам отличается от сгд писать не надо. В большинстве контор все равно резюме в начале попадёт в руки hr, которому это ничего не скажет. Лучше напиши какие задачи мл/дл умеешь решать (классификация, кластеризация, поиск аномалий итд), какими библиотеками/фреймворками владеешь. Про фундаментальные вещи по типу математики... если у тебя есть высшее тех образование, то оно сразу будет понятно, что ты в математику умеешь. А вот если у тебя был в универе курс один вышмата, то писать «математика» — рискованно. Спросят что-нибудь вообще не из математики мл и будет несильно приятно. А факт того, что ты знаешь, как с точки зрения математики работают те или иные алгоритмы мл’а, ты уже закладываешь, когда пишешь, какие задачи умеешь решать.
источник

K

K-S in Machine learning
Во всяком случае я делал именно так, когда заполнял своё cv на первую дс работу
источник

Ю

Юрий in Machine learning
K-S
1) гитхаб — это хорошо. Постарайся его наполнить чем-то посущественнее обычных домашек с курсов, конечно. Лучше всего прорешать парочку соревнований (необязательно активных в данный момент) и закинь код в гит. Это проще, чем делать свой петпроджект, поскольку данные за тебя уже собраны и при этом это все таки решение полноценной задачи от и до в отличии от обычных домашек

2) в детали а-ля знаешь чем адам отличается от сгд писать не надо. В большинстве контор все равно резюме в начале попадёт в руки hr, которому это ничего не скажет. Лучше напиши какие задачи мл/дл умеешь решать (классификация, кластеризация, поиск аномалий итд), какими библиотеками/фреймворками владеешь. Про фундаментальные вещи по типу математики... если у тебя есть высшее тех образование, то оно сразу будет понятно, что ты в математику умеешь. А вот если у тебя был в универе курс один вышмата, то писать «математика» — рискованно. Спросят что-нибудь вообще не из математики мл и будет несильно приятно. А факт того, что ты знаешь, как с точки зрения математики работают те или иные алгоритмы мл’а, ты уже закладываешь, когда пишешь, какие задачи умеешь решать.
Не правах шутки (или нет). Как корректно указать в резюме, что читаю трендовые публикации с arXiv и могу повторить их результаты, не используя их исходного кода?😂
источник

K

K-S in Machine learning
Юрий
Не правах шутки (или нет). Как корректно указать в резюме, что читаю трендовые публикации с arXiv и могу повторить их результаты, не используя их исходного кода?😂
Хм... я б, наверное, тогда заиплементил бы пару статей, выложил код в гит, а в резюме на этот момент как-то заострил бы внимание
источник

RU

Rooslan Ue in Machine learning
Здравствуйте . Для доли объяснённой дисперсии нужно использовать R- квадрат ( коэффициент детерминации) ?
источник

K

K-S in Machine learning
Rooslan Ue
Здравствуйте . Для доли объяснённой дисперсии нужно использовать R- квадрат ( коэффициент детерминации) ?
Да
источник

RU

Rooslan Ue in Machine learning
K-S
Да
Спасибо
источник

V

Valery in Machine learning
K-S
1) гитхаб — это хорошо. Постарайся его наполнить чем-то посущественнее обычных домашек с курсов, конечно. Лучше всего прорешать парочку соревнований (необязательно активных в данный момент) и закинь код в гит. Это проще, чем делать свой петпроджект, поскольку данные за тебя уже собраны и при этом это все таки решение полноценной задачи от и до в отличии от обычных домашек

2) в детали а-ля знаешь чем адам отличается от сгд писать не надо. В большинстве контор все равно резюме в начале попадёт в руки hr, которому это ничего не скажет. Лучше напиши какие задачи мл/дл умеешь решать (классификация, кластеризация, поиск аномалий итд), какими библиотеками/фреймворками владеешь. Про фундаментальные вещи по типу математики... если у тебя есть высшее тех образование, то оно сразу будет понятно, что ты в математику умеешь. А вот если у тебя был в универе курс один вышмата, то писать «математика» — рискованно. Спросят что-нибудь вообще не из математики мл и будет несильно приятно. А факт того, что ты знаешь, как с точки зрения математики работают те или иные алгоритмы мл’а, ты уже закладываешь, когда пишешь, какие задачи умеешь решать.
Спасибо большое за развернутый ответ! Согласен,так и сделаю👍🏻
источник

Ю

Юрий in Machine learning
K-S
Хм... я б, наверное, тогда заиплементил бы пару статей, выложил код в гит, а в резюме на этот момент как-то заострил бы внимание
Спасибо! Надо хорошенько подумать, в каком ключе заострять внимание. Чтоб не вышло типа "сделал то, что уже сделали до меня" или "я решил проверить ребят, хотя они опытнее меня в inf раз".
источник

K

K-S in Machine learning
Юрий
Спасибо! Надо хорошенько подумать, в каком ключе заострять внимание. Чтоб не вышло типа "сделал то, что уже сделали до меня" или "я решил проверить ребят, хотя они опытнее меня в inf раз".
Умение с нуля заиплементить нормальную статью с архива — это огого какой скилл
источник

K

K-S in Machine learning
Я б написал в скиллы и умения это, а в гите будут подтверждения
источник

Ю

Юрий in Machine learning
K-S
Я б написал в скиллы и умения это, а в гите будут подтверждения
Благодарю! Появилась доп мотивация улучшить читабельность кода, чтоб за Гит не краснеть)
источник

PK

Purity Knight in Machine learning
Мира 💫
А на компе был питон до этого?
Ага, третьего поколения
источник

RU

Rooslan Ue in Machine learning
K-S
Да
У меня метод PCA , поэтому метод r2_score мне не подходит . Я понял , что он для задач регрессии . Я ошибся , и не указал этот факт .
источник

SD

Sergey Dudoladov in Machine learning
источник

VK

Vasiliy Kashirin in Machine learning
Проверьте пожалуйста работу C3W3 (визуализацию данных)
источник