Size: a a a

2020 March 17

VS

Vasily Shabanov in Data Engineers
Может с загрузкой все хорошо, а с выводом из hive проблема?
источник

N

Nikita Blagodarnyy in Data Engineers
Dmitri Ivanov
Коллеги, подскажите пожалуйста как победить проблему кодировки русских символов при загрузке в hive таблицу из текстового файла командой load data inpath ‘/...путь к файлу’ overwrite into table имя таблицы?
Все перепробовал. Менял кодировку файла и таблицы. Не помогает((
Сделайте external table. Читайте из нее. Там можно задать кодировку. CP1251.
источник

N

Nikita Blagodarnyy in Data Engineers
DROP TABLE STG_MOVE;
CREATE EXTERNAL TABLE STG_MOVE
( Internal_row_code string ,
 Internal_header_code string
  bla-bla-bla
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '|'
LOCATION '/RAW_FILES/MOVE'
;
ALTER TABLE STG_MOVE SET SERDEPROPERTIES ('serialization.encoding'='CP1251');
источник

N

Nikita Blagodarnyy in Data Engineers
Работало уот так уот
источник

K

KrivdaTheTriewe in Data Engineers
Главное не дропнуть менедж
источник

N

Nikita Blagodarnyy in Data Engineers
Nikita Blagodarnyy
Работало уот так уот
источник
2020 March 18

А

Андрей in Data Engineers
Всем привет. Кстати, про хайв, подскажите, пожалуйста, знаете ли вы решение подобной проблемы:

org.apache.hive.service.cli.HiveSQLException: Error while compiling statement: FAILED: ParseException line 32:82 Failed to recognize predicate 'DROP'. Failed rule: 'regularBody' in statement
источник

А

Андрей in Data Engineers
Это запрос в hql скрипте
источник

R

Roman in Data Engineers
Как будто бы синтаксическая  ошибка в скрипте, может ; где забыли или спесимвол какой
источник

А

Андрей in Data Engineers
Roman
Как будто бы синтаксическая  ошибка в скрипте, может ; где забыли или спесимвол какой
Спасибо, разобрался)
источник
2020 March 19

c

ciplenok57 in Data Engineers
Всем привет. Кто сможет посоветовать материалы по спарку? Книжки, курсы. Все что можно
источник

N

Nikita Blagodarnyy in Data Engineers
источник

c

ciplenok57 in Data Engineers
источник

S

Sergei in Data Engineers
Всем привет, ктонибудь мне может подсказать где найти рабочий пример для spark standalone который мог бы продемонстировать работу одной задачи на нескольких executor, если у меня 2 и более workers? Проще говоря,  возможно ли распределение вычисления между несколькими машинами в кластера или к примеру это работает только в yarn?
источник

AS

Andrey Smirnov in Data Engineers
Sergei
Всем привет, ктонибудь мне может подсказать где найти рабочий пример для spark standalone который мог бы продемонстировать работу одной задачи на нескольких executor, если у меня 2 и более workers? Проще говоря,  возможно ли распределение вычисления между несколькими машинами в кластера или к примеру это работает только в yarn?
в примерах есть вычисление числа пи
источник

A

Alex in Data Engineers
@smirnov_captain wordcount уже не в моде? =)
источник

AS

Andrey Smirnov in Data Engineers
Alex
@smirnov_captain wordcount уже не в моде? =)
хз, я за модой не слежу, до сих пор на hadoop c yarn :)
источник

A

Alex in Data Engineers
ну так же ... поэтому и спросил, так как по мне он само простой показать что несколько экзекуторов работали
источник

DZ

Dmitry Zaytsev in Data Engineers
А кто какие версии хадупов использует? И где берете? Клудера, мапр, что то еще?
источник

DZ

Dmitry Zaytsev in Data Engineers
Интересно
источник