Кстати, у меня тоже вопрос: чем сейчас модно организовывать хранилища данных для мл? Главная проблема в том, что это не данные с прода, например, а данные, которые наши мл-разрабы насобирали по помойкам и используют для обучения моделей. Затык в том, что сами они ленятся удалять старье, а место не резиновое