Size: a a a

2019 October 05

DL

Dmitry Listkov in Data Engineers
mapred streaming \
       -D mapred.reduce.tasks=1 \
       -D mapred.output.compress=true \
       -D mapred.compress.map.output=true \
       -D mapred.output.compression.codec=com.hadoop.compression.lzo.LzopCodec \
       -input /user/hadoop/mapreduce/input \
       -output /user/hadoop/mapreduce/archive \
       -mapper /bin/cat \
       -reducer /bin/cat
источник

DL

Dmitry Listkov in Data Engineers
так объединяю файлы
источник

DL

Dmitry Listkov in Data Engineers
mapred streaming \
   -D stream.map.input.ignoreKey=true \
   -file $MAPPER_FILE \
   -file $REDUCER_FILE \
   -mapper $MAPPER_FILE \
   -reducer $REDUCER_FILE \
   -inputformat com.hadoop.mapred.DeprecatedLzoTextInputFormat \
   -inputreader "StreamXmlRecordReader,begin=<html,end=</html>" \
   -numReduceTasks 1 \
   -input $INPUT_DIR \
   -output $OUTPUT_DIR
источник

DL

Dmitry Listkov in Data Engineers
а так уже обрабатываю
источник

DL

Dmitry Listkov in Data Engineers
на выгоде html некорректный(
источник

ПФ

Паша Финкельштейн in Data Engineers
источник

ПФ

Паша Финкельштейн in Data Engineers
На котлине под спарк можно писать приятнее чем на джаве
источник

DM

Daniel Matveev in Data Engineers
Паша Финкельштейн
На котлине под спарк можно писать приятнее чем на джаве
главное чтоб ты счастлив был
источник

ПФ

Паша Финкельштейн in Data Engineers
Ну я так, развлекаюсь. Потому и счастлив )
источник

ПФ

Паша Финкельштейн in Data Engineers
Вряд ли это можно взять и затащить в прод вот так вот просто )
источник
2019 October 06

В

Вадим in Data Engineers
Паша Финкельштейн
На котлине под спарк можно писать приятнее чем на джаве
а что со скалой не так?
источник

ПФ

Паша Финкельштейн in Data Engineers
Вадим
а что со скалой не так?
Да не, всё так со скалой. Но котлин мне конечно же больше нравится
источник

В

Вадим in Data Engineers
Паша Финкельштейн
Да не, всё так со скалой. Но котлин мне конечно же больше нравится
чем, если не секрет? Котлин - беттер жава. Все то же есть в скала
источник

В

Вадим in Data Engineers
мб я не знаю чего то
источник

DM

Daniel Matveev in Data Engineers
давайте свернем этот офтоп сразу
источник

В

Вадим in Data Engineers
Daniel Matveev
давайте свернем этот офтоп сразу
тут так нельзя? Ну ок
источник

ПФ

Паша Финкельштейн in Data Engineers
Вадим
чем, если не секрет? Котлин - беттер жава. Все то же есть в скала
Я тебе в личку напишу
источник

DM

Daniel Matveev in Data Engineers
Паша Финкельштейн
Я тебе в личку напишу
👍
источник

EV

Eduard Vlasov in Data Engineers
Привет ребятки!
Сталкивались ли вы с задачей возврата результатов работы некой модели обратно в продукт или связанные с ним тулы типа CRM, как решали?
источник

RI

Rustam Iksanov in Data Engineers
Eduard Vlasov
Привет ребятки!
Сталкивались ли вы с задачей возврата результатов работы некой модели обратно в продукт или связанные с ним тулы типа CRM, как решали?
rest, kafka
источник