Size: a a a

ML Boot Camp Official

2020 November 28

OC

Oleg Cheremisin in ML Boot Camp Official
никто не знает, есть ли какое-то открытое апи, с которого можно картинки еды брать по запросу? типа как котиков по коду хттп ошибке выдают на https://http.cat/200, но не котиков, а еду
источник

K

K-S in ML Boot Camp Official
кароче я хочу просто используя imblrean.SMOTE запустить оверсемплинг трейна, и чтобы модель красиво прогонялась через cross_val_score
Надо писать cv в цикле тогда и делать оверсэмплинг внутри цикла
источник

in ML Boot Camp Official
Можно и так, просто хотелось стандартный cross_val_score юзать
источник

in ML Boot Camp Official
Я использовал маленький костыль, просто руками добавил декоратор который обрабатывает аргументы до обучения
источник

in ML Boot Camp Official
def balance_decor(fit_function):
   def new_fit(X, y):
       # your code here
       X_balanced,Y_balanced = ...
       return fit_function(X_balanced,Y_balanced)
   return new_fit

def wrap_new_fit(model):
   model.fit = balance_decor(model.fit)
   return model

wrap_new_fit(RandomForestClassifier(max_depth=15, random_state=0))
источник

D

Denis in ML Boot Camp Official
Oleg Cheremisin
никто не знает, есть ли какое-то открытое апи, с которого можно картинки еды брать по запросу? типа как котиков по коду хттп ошибке выдают на https://http.cat/200, но не котиков, а еду
imagenet они дают ссылки на картинки сортированные по контенту
источник

D

Denis in ML Boot Camp Official
есть датасетю но к нему доступ по универской почте,  мне уже пол года ее не подтверждают(
источник

АС

Андрей S[A]M Сергеев... in ML Boot Camp Official
Появился непонятный эффект с gpt-3... При дообучении на большом кол-ве данных, оно выдаёт результат хуже, нежели при маленьком кол-ве данных... Может кто знает в чем тут дело... Заранее спасибо...
источник

SF

Sergei Fironov in ML Boot Camp Official
Андрей S[A]M Сергеев
Появился непонятный эффект с gpt-3... При дообучении на большом кол-ве данных, оно выдаёт результат хуже, нежели при маленьком кол-ве данных... Может кто знает в чем тут дело... Заранее спасибо...
чем больше данных, тем дальше уходит от претрейна. видимо, lr слишком большой и оверфитится на свежие данные
источник

SF

Sergei Fironov in ML Boot Camp Official
AdamW и lr ваши лучшие друзья
источник

АС

Андрей S[A]M Сергеев... in ML Boot Camp Official
То есть можно поставить lr меньше или забить и трейнить на маленьком объёме...
источник

SF

Sergei Fironov in ML Boot Camp Official
лучше трейнить на большом, а lr поменьше - при прочих равных больше шансов получить хорошее решение
источник

АС

Андрей S[A]M Сергеев... in ML Boot Camp Official
Спасибо
источник

d

dePuff in ML Boot Camp Official
у них для этого даже специальный свой пайплан есть
Именно потому он и есть, чтобы только трейн мучать )
источник
2020 November 29

AT

Alexey Tikhonov in ML Boot Camp Official
Позравляю наших участников чатика с ЦП, Олега в частности ;)
источник

AT

Alexey Tikhonov in ML Boot Camp Official
с победой в смысле
источник

OC

Oleg Cheremisin in ML Boot Camp Official
Обоих! И Диму и кто тут еще есть )
источник

ДВ

Дима Васькин... in ML Boot Camp Official
Спасибо)
И Альбину!!)
источник

OC

Oleg Cheremisin in ML Boot Camp Official
Да, вы супер зашатали данные!
источник

AC

Albina Colindonolwe in ML Boot Camp Official
привет)
источник