какой дистрибутив hadoop используете (предполагается, что это production-case и нету планов по смене дистрибутива, т.е. схема рабочая)
Анонимный опрос
0%
собираю сам из дистрибутивов-первоисточников
0%
CDP
0%
BigTop
0%
arenadata
0%
автор, ты не в теме, есть еще вариант Х, я использую его
0%
не использую hadoop, покажите ответы
Проголосовало: 101
Какие стратегии бранчинга используют в вашей компании?
Анонимный опрос
26%
Github Flow
19%
Gitlab Flow
16%
Git Flow
13%
Release Flow
26%
Другое
Проголосовало: 62
У нас ci/cd…
Анонимный опрос
33%
Jenkins
12%
Teamcity
0%
Trevis
1%
CircleCI
35%
GitlabCI
7%
GithubActions
8%
sh скрипты рулят
4%
Другая менее популярная поделка
Проголосовало: 100
Как у вас называется главная ветка?
Анонимный опрос
94%
master, клал на всё это
6%
main
Проголосовало: 63
Что ещё, помимо Hadoop, вы используете для аналитики у себя в компании (доступен мультивыбор)?
Анонимный опрос
13%
Spark, но без Hadoop
15%
S3
14%
Clickhouse
1%
Amazon Redshift
8%
Google BigQuery
1%
Snowflake
7%
Greenplum
21%
Одну из: Teradata, Oracle, Vertica, Exasol
19%
Одну из: PostgreSQL, MySQL
1%
Другое (напишите, пожалуйста, в чат ответом на опрос)
Проголосовало: 107
Сколько нод Hadoop (включая NN) используется у вас в компании?
Анонимный опрос
5%
2-4
4%
4-8
12%
8-6
17%
16-40
17%
40-100
45%
Больше 100
Проголосовало: 76
Если вы собираетесь мигрировать, то на какой дистрибутив?
Анонимный опрос
9%
На Cloudera
5%
На Hortonworks (шта?)
22%
На свою сборку (Bigtop или нет)
11%
На AWS (Elastic MapReduce) [Cloud]
0%
На Azure HDInsight [Cloud]
14%
На Google Cloud Platform (Dataproc) [Cloud]
8%
На Яндекс.Облако (Dataproc) [Cloud]
12%
На Arenadata Hadoop (ADH)
0%
На Mail Cloud Solutions (Big Data) [Cloud]
20%
Не на Hadoop, другое решение (напишу в чат)
Проголосовало: 65
Какой дистрибутив Hadoop используется у вас в компании (доступен мультивыбор)?
Анонимный опрос
32%
Cloudera
17%
Hortonworks
11%
Собрали сами (Bigtop или нет)
14%
AWS (Elastic MapReduce) [Cloud]
2%
Azure HDInsight [Cloud]
7%
Google Cloud Platform (Dataproc) [Cloud]
1%
Яндекс.Облако (Dataproc) [Cloud]
7%
Arenadata Hadoop (ADH)
0%
Mail Cloud Solutions (Big Data) [Cloud]
8%
Другой дистрибутив (напишу в чат)
Проголосовало: 98
Облако или свои железки?
Анонимный опрос
46%
Облако
54%
Своё ближе к телу
Проголосовало: 105
Иду на смартдатаконф ради Хрыча
Анонимный опрос
43%
Да
27%
Нет
30%
Я и сам в своём роде Старый
Проголосовало: 44
Если у меня будет возможность, я бы писал...
Анонимный опрос
24%
Прикладной код на Java
37%
Прикладной код на Scala
21%
Прикладной код на Python
11%
Прикладной код на чём-то экзотическом
11%
ETL на Java
46%
ETL на Scala (spark sql решает)
24%
ETL на Python
7%
ETL на чём-то экзотическом
Проголосовало: 89
27 февраля 19.00 пивбар митап DE с онлайн трансляцией
Анонимный опрос
29%
Пойду
38%
Хотелось бы, но не смогу
33%
Посмотрю онлайн
Проголосовало: 48
Всем привет. Задался вопросом, насколько сейчас Python популярнее или не популярнее Scala/Java для разработки Spark. Какой API вы используете для Spark?