Size: a a a

2021 March 10

GP

Grigory Pomadchin in Data Engineers
Dan Y
из общения с другими инженерами. Они говорят что CPU больше не проблема потому что есть инстансы с GPU. И вот тут можно упереться в диски
а разве инженеры не хранят дату часто на всяких s3?
источник

GP

Grigory Pomadchin in Data Engineers
ну в этом плане тогда действительно ио медленное мож быть
источник

UD

Uncel Duk in Data Engineers
Дальше когда начинаются заигрывания с ALS и картами утыкаешься по IO
источник

TT

Tsh Tsh in Data Engineers
Попробуйте матрицы из этого алгоритма хранить в своем сторадже
источник

DY

Dan Y in Data Engineers
Tsh Tsh
Очень распространенный и довольно "старый" алгоритм
Реализован в спарке и многих других либах / фреймворках
спарк это просто исполнитель заданного кода, мне бы поконкретнее
источник

TT

Tsh Tsh in Data Engineers
Dan Y
спарк это просто исполнитель заданного кода, мне бы поконкретнее
Я не про Спарк, я про матрицы из этого алгоритма
источник

DY

Dan Y in Data Engineers
Grigory Pomadchin
а разве инженеры не хранят дату часто на всяких s3?
ну это вообще не фактор в моем случае. Там где хватает S3 - мне ловить нечего :)
источник

DY

Dan Y in Data Engineers
Tsh Tsh
Я не про Спарк, я про матрицы из этого алгоритма
имеется ввиду ALS?
источник

UD

Uncel Duk in Data Engineers
пример таких костылей https://github.com/Microsoft/BLAS-on-flash
источник

TT

Tsh Tsh in Data Engineers
Берете любую опенс сорс либу с этим алгоритмом
И пишете / читаете в свой сторадж
Да я про ALS
источник

DY

Dan Y in Data Engineers
Uncel Duk
Дальше когда начинаются заигрывания с ALS и картами утыкаешься по IO
estx konkretnyj `z kejs kotoryj q smogu prosimulirowatx?
источник

TT

Tsh Tsh in Data Engineers
Просто чтобы дать нагрузку
источник

GP

Grigory Pomadchin in Data Engineers
ого не видел
источник

GP

Grigory Pomadchin in Data Engineers
крутой костыль
источник

DY

Dan Y in Data Engineers
ага, спасибо. буду ковырять. Вообще, если быстрый распределенный сторедж (который не сеф) под кубер интересует, буду рад пообщаться, не в плане продать а скорее изучить нужду и попробовать поднять имплементацию
источник

UD

Uncel Duk in Data Engineers
Dan Y
estx konkretnyj `z kejs kotoryj q smogu prosimulirowatx?
Ченить такое потыкать https://github.com/benfred/implicit
источник

UD

Uncel Duk in Data Engineers
+публичный датасет
источник

DY

Dan Y in Data Engineers
мерси :)
источник

UD

Uncel Duk in Data Engineers
либо забить болт и сразу взять rapids
источник

GP

Grigory Pomadchin in Data Engineers
+
источник