Телеграмм чат группы hadoopusers страница 2176

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

1787 membersпожаловаться на группу

2020 March 24

MB

Mikhail Butalin in Data Engineers

у меня CDH, на нём репликация настроена. И она снепшоты делает но не чистит иногда, почемуто

источник

11:39пожаловаться #1

MB

Mikhail Butalin in Data Engineers

не нашёл как посмотреть еще размер снапшотов

источник

11:40пожаловаться #2

S

Stanislav in Data Engineers

в .snapshots лежат директории снепшотов
найди нужную тебе директорию и сделай ду на нее

источник

11:53пожаловаться #3

А

Андрей in Data Engineers

У тебя строго определенная структура файла?

В каком плане? Количество значений в строках csv-файла вроде одинаковое

источник

12:15пожаловаться #4

M

Mi in Data Engineers

Mikhail Butalin

hdfs dfs -ls не показывает ничего

а если hdfs -ls -a?

источник

12:22пожаловаться #5

M

Mi in Data Engineers

хотя хадуп вроде не скрывает папки вообще

источник

12:23пожаловаться #6

MB

Mikhail Butalin in Data Engineers

Разобрался...

источник

13:46пожаловаться #7

MB

Mikhail Butalin in Data Engineers

snapshots

источник

13:46пожаловаться #8

MB

Mikhail Butalin in Data Engineers

директория снапшотилась, а файлы в процессе удалились

источник

13:47пожаловаться #9

FL

Fedor Lavrentyev in Data Engineers

Коллеги, вопрос на миллион.
Я правильно понимаю, что вот это - богом забытый бенчмарк, а в его топе древние сабмиты из прошлого десятилетия?
http://www.tpc.org/tpcc/results/tpcc_advanced_sort5.asp?PRINTVER=false&FLTCOL1=c_cluster&FLTCOLOPR1=EXACTLY&FLTCHO1=Y&FLTFREEFRM1=off&ADDFILTERROW=&filterRowCount=1&SRTCOL1=c_tpmc&SRTDIR1=DESC&ADDSORTROW=&sortRowCount=1&DISPRES=100+PERCENT&include_withdrawn_results=none&include_historic_results=yes

источник

15:22пожаловаться #10

FL

Fedor Lavrentyev in Data Engineers

(ну, кроме первого, он свеженький)

источник

15:22пожаловаться #11

GP

Grigory Pomadchin in Data Engineers

Судя по датам - да)

источник

15:30пожаловаться #12

АЖ

Андрей Жуков in Data Engineers

Fedor Lavrentyev

Коллеги, вопрос на миллион.
Я правильно понимаю, что вот это - богом забытый бенчмарк, а в его топе древние сабмиты из прошлого десятилетия?
http://www.tpc.org/tpcc/results/tpcc_advanced_sort5.asp?PRINTVER=false&FLTCOL1=c_cluster&FLTCOLOPR1=EXACTLY&FLTCHO1=Y&FLTFREEFRM1=off&ADDFILTERROW=&filterRowCount=1&SRTCOL1=c_tpmc&SRTDIR1=DESC&ADDSORTROW=&sortRowCount=1&DISPRES=100+PERCENT&include_withdrawn_results=none&include_historic_results=yes

я обычно ищу методологии и делаю сам на своей инфре бенчи
потому что два бенча как две статистики

источник

15:31пожаловаться #13

FL

Fedor Lavrentyev in Data Engineers

Ну это чисто пузомерка

источник

15:31пожаловаться #14

FL

Fedor Lavrentyev in Data Engineers

Но какая-то древняя как смерть

источник

15:31пожаловаться #15

A

Alex in Data Engineers

почему древняя =) вон аликлауд засабмитил пол года назад резалты =)

источник

15:36пожаловаться #16

YI

Yukari I in Data Engineers

В каком плане? Количество значений в строках csv-файла вроде одинаковое

Я про делиметеры и символы перевода строк, в частности. Еще неплохо бы в кавычки взять текст и привести дату к единому формату

источник

15:47пожаловаться #17

А

Андрей in Data Engineers

Я про делиметеры и символы перевода строк, в частности. Еще неплохо бы в кавычки взять текст и привести дату к единому формату

С датами была небольшая проблема, они были в неправильном формате, но дело, скорее всего, было не в этом.
Получилось по предыдущему совету - сначала записать в экстернал таблицу (причем непартиционированную), потом уже перегнать в интернал с партициями.
При загрузке в экстернал хайв не ругался, при попытке повторить напрямую лоад в интернал - null pointer exception.

источник

20:32пожаловаться #18

А

Андрей in Data Engineers

В общем, спасибо большое, буду знать)

источник

20:32пожаловаться #19

D

Dasha in Data Engineers

Случилась беда: когда добавила отмеченный на картинке jar-path, spark в Zeppelin сломался совсем;
Ошибка:

org.apache.zeppelin.interpreter.InterpreterException: org.apache.zeppelin.interpreter.InterpreterException: Fail to open SparkInterpreter

Но после удаления данной jar-path и перезапуска интерпретатора и даже всего сервиса Zeppelin ошибка сохранилась

источник

21:02пожаловаться #20