Size: a a a

2020 October 28

АА

Алексей Артамонов... in Data Engineers
ребят а кто подскажет по JupyterHub
источник

SS

Sergey Sheremeta in Data Engineers
суть такова: есть hbase-kafka-proxy, который репликацию HBase заруливает в Kafka, но в топике Kafka в итоге сообщения с мутациями ( rowkey + измененное поле)
источник

AZ

Anton Zadorozhniy in Data Engineers
Алексей Артамонов
ребят а кто подскажет по JupyterHub
а какой у вас spawner/authenticator?
источник

АА

Алексей Артамонов... in Data Engineers
меня интересует, я правильно понимаю что настройки для procy user прописываются в core-site.xml? как после рестартить конфиг? у меня нет амбари на текущий момент?
источник

АА

Алексей Артамонов... in Data Engineers
Anton Zadorozhniy
а какой у вас spawner/authenticator?
YarnSpawner использую
источник

SS

Sergey Sheremeta in Data Engineers
надо получить полную строку!!
для этого хотим Spark Streaming, но сначала отлаживаемся на маленькой батчевой порции данных - делаем лукап по RDD с rowkey мутаций в HBase
источник

АА

Алексей Артамонов... in Data Engineers
@dartov а авторизация через pam я так понимаю
источник

SS

Sergey Sheremeta in Data Engineers
Sergey Sheremeta
надо получить полную строку!!
для этого хотим Spark Streaming, но сначала отлаживаемся на маленькой батчевой порции данных - делаем лукап по RDD с rowkey мутаций в HBase
https://gist.github.com/ssheremeta/6d28db0cff10e19bff741c92b756801d

может сразу ошибку в коде увидите?
источник

AZ

Anton Zadorozhniy in Data Engineers
Sergey Sheremeta
суть такова: есть hbase-kafka-proxy, который репликацию HBase заруливает в Kafka, но в топике Kafka в итоге сообщения с мутациями ( rowkey + измененное поле)
что такое поле, cell?
источник

SS

Sergey Sheremeta in Data Engineers
Anton Zadorozhniy
что такое поле, cell?
да! у нас поверх HBase используется Phoenix - поэтому используем и терминологию таблиц
источник

AZ

Anton Zadorozhniy in Data Engineers
Алексей Артамонов
меня интересует, я правильно понимаю что настройки для procy user прописываются в core-site.xml? как после рестартить конфиг? у меня нет амбари на текущий момент?
да, прокси пользователя надо писать в core-site.xml, ну и для этого пользователя надо иметь SPN и keytab
источник

АА

Алексей Артамонов... in Data Engineers
а если не используется keytab
источник

АА

Алексей Артамонов... in Data Engineers
просто учетки ОС
источник

AZ

Anton Zadorozhniy in Data Engineers
Алексей Артамонов
а если не используется keytab
в хадупе безопасность выключена? (керберос)
источник

АА

Алексей Артамонов... in Data Engineers
по настройкам керберос я так понял нет
источник

АА

Алексей Артамонов... in Data Engineers
ну т.е сам керберос не настроен
источник

AS

Andrey Smirnov in Data Engineers
у results вызови .toList вместо .toIterator
источник

AZ

Anton Zadorozhniy in Data Engineers
Алексей Артамонов
по настройкам керберос я так понял нет
сделайте sudo su - <ваш пользователь JH> на сервере JH и потыкайте HDFS через CLI
источник

АА

Алексей Артамонов... in Data Engineers
так тыкал всякие hdfs dfs -ls и т.п
источник

АА

Алексей Артамонов... in Data Engineers
я могу скрин ошибки сюда показать?
источник