Всем привет!
Может быть кто сталкивался?
Нужно включить transfer acceleration для связки Spark + aws S3
Больше контекста:
Пишем сарком в S3 бакет, кторый живёт в другом регионе.
Понятное дело пишется долго и не влезаем в таймуты.
Бест практики советуют в этом случае использовать acceleration endpoint.
В бакете это дело включили
В спарке ендпоинт подменили
(добавили
'spark.hadoop.fs.s3a.endpoint': 'https://s3-accelerate.amazonaws.com'
в спарк сессию)
Пробуем записать и ошибка:
An error occurred while calling o104.parquet.
: java.lang.IllegalStateException: To enable accelerate mode, please use AmazonS3ClientBuilder.withAccelerateModeEnabled(true)
at com.amazonaws.services.s3.AmazonS3Client.setEndpoint(AmazonS3Client.java:659)
Получается, что единственный путь - пересобирать джарник из исходников с заменой одного булевского значения
Чувсвтую, что можно проще. но не понимаю как