Size: a a a

2019 February 19

N

Nikolay in Moscow Spark
Ну так не стало понятнее. Как это увидеть на уровне полей класса ?
источник

PK

Pavel Klemenkov in Moscow Spark
Nikolay
Ну так не стало понятнее. Как это увидеть на уровне полей класса ?
Я реально не догоняю вопрос. Интерфейс класса можно почитать здесь https://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.sql.Dataset
источник

AI

Andrei Iatsuk in Moscow Spark
По-моему в этом чатике уже спрашивали нечто подобное.
источник

GP

Grigory Pomadchin in Moscow Spark
наверное надо начать с самого начала знакомство со спарком.

что есть rdd? и как операции на них проводятся; джойны, мапы, и т.п.

что происходит при редьюсе с данными

ну и потом уже прочитать что такое датасеты, скуль в спарке, ну и как происходят там все те же операции что можно делать и с рдд.

по вопросу не ясно как отвечать; на сколько ТС знает то о чем спрашивает
источник

GP

Grigory Pomadchin in Moscow Spark
а так есть попсовая на половину маркетинговая статья от датабрикс https://databricks.com/blog/2016/07/14/a-tale-of-three-apache-spark-apis-rdds-dataframes-and-datasets.html
источник

GP

Grigory Pomadchin in Moscow Spark
первая ссылка в гугле по rdd vs dataset у меня
источник

GP

Grigory Pomadchin in Moscow Spark
^ да можно по таким запросам побольше погуглить по ключевым словам
источник
2019 February 20

К

Костя in Moscow Spark
Всем привет, EMR кластер с spark и hive, создаю таблицу через spark shell, но в hive shell ничего нет и наоборот, в Hue тоже самое, разные метасторы…
Пробовал добавлять hive.metastore.warehouse.dir  в /etc/spark|hive/conf/hive-site.xml и ребутать сервисы - результата не дало. куда копать???
источник

ЕГ

Евгений Глотов... in Moscow Spark
Ещё есть hive.metastore.uris
источник

К

Костя in Moscow Spark
Евгений Глотов
Ещё есть hive.metastore.uris
там дефолтное thrift://ip-172-61-11-168.dev.local:9083
источник
2019 February 22

K

KrivdaTheTriewe in Moscow Spark
@tenKe скажи пожалуйста,  у вас структурный стриминг с несколькими query и разыми тригеррами адекватно работает?
источник

t

tenKe in Moscow Spark
не пробовал так в рамках одной джобы
источник

t

tenKe in Moscow Spark
в смысле разные триггеры не пробовал
источник

t

tenKe in Moscow Spark
что, плохо работает?
источник

K

KrivdaTheTriewe in Moscow Spark
) да я думаю сделать пока что
источник

PK

Pavel K in Moscow Spark
Хоть и не меня спросили, но нормально работает, даже в той самой первой версии, когда питонье API было скрыто и содержало опечатку в импорте.)
источник
2019 February 24

С

Сюткин in Moscow Spark
Задам глупый вопрос, в спарке можно вызвать системный календарь с возможностью выбора последних 6 месяцев в дневной разбивке?) по аналогии sys_calendar в терадате или надо создавать отдельный датафрейм с указанием нужных дат?
источник

ЕГ

Евгений Глотов... in Moscow Spark
В одной колонке current_date, в другой explode(range(-183, 0)), потом add_days)
источник

С

Сюткин in Moscow Spark
О!) круто, спасибо Женя :)
источник

ЕГ

Евгений Глотов... in Moscow Spark
👌
источник