Ладно, а давайте я другой вопрос задам.
Есть паркет опять же на S3
Данные по продажам, 20 Гб, 30 млн строк
Структура
User_id: long
Created_date: timestamp
Amount: long
Type: string
Company: string
Партии по дням
Хочу создать таблицу для аналитики
На каждый день по одному пользователю коммулятивную сумму продаж.
Если продажи были 1го числа 10 и 3го 20
Тогда должно быть
1-10
2-10
3-30
Как легче всего это реализовать ?