Телеграмм чат группы hadoopusers страница 1400

Size: a a a

Data Engineers

2019 June 27

~$ which python
/usr/bin/python
:~$ which python3
/usr/bin/python3
:~$ which python2.7
/usr/bin/python2.7

источник

13:53пожаловаться #1

George Gaál in Data Engineers

что за факамаза

источник

13:53пожаловаться #2

Oleg Ilinsky in Data Engineers

у меня базовый докер-образ - это python3.6

источник

13:54пожаловаться #3

Oleg Ilinsky in Data Engineers

ну я так понимаю, тут можно симлинками накостылять

источник

13:55пожаловаться #4

George Gaál in Data Engineers

можно

источник

13:58пожаловаться #5

George Gaál in Data Engineers

а причем тут базовый докер? Ты амбари в докер пытаешься вставить? :-/

источник

13:58пожаловаться #6

Oleg Ilinsky in Data Engineers

George Gaál

а причем тут базовый докер? Ты амбари в докер пытаешься вставить? :-/

не, мне в докере нужен клиент спарковский, чтобы на кластер сабмитить джобы.
Я вчера ещё про это писал)
Я попробовал просто репы апачевские поставить https://archive.apache.org/dist/spark/spark-2.3.2 spark-2.3.2-bin-without-hadoop.tgz , но они, похоже, не дружат с hdp3 и валились с ошибками, что class not found и всё такое.

источник

14:06пожаловаться #7

George Gaál in Data Engineers

понятно

источник

14:06пожаловаться #8

Oleg Ilinsky in Data Engineers

там всё логирование принтами сделано :///

источник

14:18пожаловаться #9

Vladislav 👻 Shishkov in Data Engineers

Oleg Ilinsky

Привет) вопрос
Можно ли поставить тулы из hdp3 имея python3.6 как системный?
https://docs.hortonworks.com/HDPDocuments/Ambari-2.7.3.0/bk_ambari-installation/content/hdp_31_repositories.html
Пробовал из вот этих репозиториев для убутны 18 - падает.

в некоторых скриптах по хардкору прописан питон

источник

14:49пожаловаться #10

Oleg Ilinsky in Data Engineers

Vladislav 👻 Shishkov

в некоторых скриптах по хардкору прописан питон

ага, я вот пытался часть скриптов переделать на python3, но чёт не зашло

источник

15:50пожаловаться #11

Oleg Ilinsky in Data Engineers

Exception in thread "main" java.lang.NullPointerException
  at scala.collection.mutable.ArrayOps$ofRef$.length$extension(ArrayOps.scala:192)
  at scala.collection.mutable.ArrayOps$ofRef.length(ArrayOps.scala:192)
  at scala.collection.IndexedSeqOptimized$class.foreach(IndexedSeqOptimized.scala:32)
  at scala.collection.mutable.ArrayOps$ofRef.foreach(ArrayOps.scala:186)
  at org.apache.spark.deploy.yarn.Client$$anonfun$createConfArchive$1.apply(Client.scala:747)
  at org.apache.spark.deploy.yarn.Client$$anonfun$createConfArchive$1.apply(Client.scala:739)
  at scala.Option.foreach(Option.scala:257)
  at org.apache.spark.deploy.yarn.Client.createConfArchive(Client.scala:739)
  at org.apache.spark.deploy.yarn.Client.prepareLocalResources(Client.scala:700)
  at org.apache.spark.deploy.yarn.Client.createContainerLaunchContext(Client.scala:921)
  at org.apache.spark.deploy.yarn.Client.submitApplication(Client.scala:169)
  at org.apache.spark.deploy.yarn.Client.run(Client.scala:1256)
  at org.apache.spark.deploy.yarn.YarnClusterApplication.start(Client.scala:1627)
  at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:904)
  at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:198)
  at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:228)
  at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:137)
  at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
19/06/27 12:55:05 INFO util.ShutdownHookManager: Shutdown hook called
19/06/27 12:55:05 INFO util.ShutdownHookManager: Deleting directory /tmp/spark-e20edae6-08d7-4230-a276-ca4037ea3a73

источник

15:56пожаловаться #12

Oleg Ilinsky in Data Engineers

вот со вторым питонов вот такая хрень
я чёт не договняю, в чём ошибка

источник

15:57пожаловаться #13

mel kaye in Data Engineers

а под R есть биндинги для хадупа/спарка?

источник

15:58пожаловаться #14

Grigory Pomadchin in Data Engineers

mel kaye

а под R есть биндинги для хадупа/спарка?

есть для спарка

источник

15:58пожаловаться #15

Grigory Pomadchin in Data Engineers

https://github.com/apache/spark/tree/master/R

GitHub

apache/spark

Apache Spark. Contribute to apache/spark development by creating an account on GitHub.

источник

15:58пожаловаться #16

Sergey Bilenko in Data Engineers

Посмотрел сегодня Arena Data Platform. Что-то он очень затейливо разворачивается - инструкция по установке на пару десятков страниц. А есть у Arenadata какая-нибудь быстроустанавливаемая песочница, типа Hortonworks Sandbox, чтобы поиграться на мощном десктопе и не заморачиваться с разворачиванием в кластере?

источник

17:28пожаловаться #17

George Gaál in Data Engineers

Anton Kovalenko ?

источник

17:36пожаловаться #18

Anton Kovalenko in Data Engineers

Sergey Bilenko

А что конкретно хотите развернуть из нашего стека? Речь про Хадуп?

источник

17:53пожаловаться #19

Sergey Bilenko in Data Engineers

Anton Kovalenko

А что конкретно хотите развернуть из нашего стека? Речь про Хадуп?

Больше Spark интересует

источник

17:56пожаловаться #20