Size: a a a

2020 March 23

SZ

Sergey Zakharov in Data Engineers
Mikhail Epikhin
Возьмите тогда просто то облако, которым уже пользуетесь и все:)
Или если его нет, то то что ближе или куда с бОльшей вероятностью будете другие компоненты / данные перемещать когда-нибудь.
Облаками пока еще не пользовались, есть hadoop-кластер из арендованных машин, но он загружен, вот как раз причина попробовать посчитать в облаках, было интересно, чем кто пользуется
источник

AE

Alexey Evdokimov in Data Engineers
гуглом, ажуром, амазоном. разница не сильно большая, но чем свежее облако, тем у него настройка проще
источник

AE

Alexey Evdokimov in Data Engineers
самый древний авс, с ним больше всего всякой мелкой мороки.
а вообще, найдите где-нибудь у себя человека, который их хоть как-то нюхал, и попросите показать
источник

ME

Max Efremov in Data Engineers
P.S. Тут есть у кого опыт спаривания Amazon Athena и Tableau?
источник

SZ

Sergey Zakharov in Data Engineers
Alexey Evdokimov
самый древний авс, с ним больше всего всякой мелкой мороки.
а вообще, найдите где-нибудь у себя человека, который их хоть как-то нюхал, и попросите показать
Спасибо
источник

А

Андрей in Data Engineers
Всем привет.
Ребята, подскажите, пожалуйста, с чем может быть связана ошибка при попытке загрузки информации с csv файла в Hive-таблицу:
Error: Error while compiling statement: FAILED: NullPointerException null (state=42000,code=40000)
источник

А

Андрей in Data Engineers
запрос вида
LOAD DATA LOCAL INPATH '%filename%.csv' OVERWRITE INTO TABLE %tablename% PARTITION (partition_name)
источник

А

Андрей in Data Engineers
Мне говорили, что такое возможно, т.к. при считке с csv хайв может создавать дополнительные пустые партиции, и из-за этого джоба может валиться. Но это не точно
источник
2020 March 24

GP

Grigory Pomadchin in Data Engineers
попробуй положить в зеппелиновский пас какойнить
источник

GP

Grigory Pomadchin in Data Engineers
@fall_out_bug может быть прав
источник

D

Dasha in Data Engineers
хм, то есть перенести сам файл в папку zeppelin’а?
источник

YI

Yukari I in Data Engineers
Андрей
Всем привет.
Ребята, подскажите, пожалуйста, с чем может быть связана ошибка при попытке загрузки информации с csv файла в Hive-таблицу:
Error: Error while compiling statement: FAILED: NullPointerException null (state=42000,code=40000)
Подключи external table, из нее уже забери в таблицу хайв
источник

А

Андрей in Data Engineers
Yukari I
Подключи external table, из нее уже забери в таблицу хайв
Спасибо за совет, утром попробую
источник

YI

Yukari I in Data Engineers
Андрей
Спасибо за совет, утром попробую
У тебя строго определенная структура файла?
источник

MB

Mikhail Butalin in Data Engineers
Пустая директория...
hdfs dfs -ls ничего не показывает
hdfs dfs -du  тоже

А hdfs dfs -du -s  говорит 2.3 ТБ

Как такое может быть?
источник

S

Stanislav in Data Engineers
снепшотов нет?
источник

A

Alex in Data Engineers
The -s option will result in an aggregate summary of file lengths being displayed, rather than the individual files. Without the -s option, calculation is done by going 1-level deep from the given path.
источник

A

Alex in Data Engineers
может что в скрытых папках
источник

MB

Mikhail Butalin in Data Engineers
Alex
может что в скрытых папках
hdfs dfs -ls не показывает ничего
источник

MB

Mikhail Butalin in Data Engineers
Stanislav
снепшотов нет?
Есть на родительскую директорию. Думаете в них дело?
источник