Телеграмм чат группы moscowspark страница 107

Size: a a a

Moscow Spark

872 membersпожаловаться на группу

2019 April 08

Kostya Shchetkin in Moscow Spark

Simon Osipov

.save() должен быть?

Да

источник

19:04пожаловаться #1

Kostya Shchetkin in Moscow Spark

(
df.write.format("jdbc")
.option("useUnicode", "true")
.option("characterEncoding", "UTF-8")
.options(url=mssql_connection,
dbtable=mssql_table,
driver=driver
).mode('append').save()
)

источник

19:05пожаловаться #2

Kostya Shchetkin in Moscow Spark

Так пайспарком в mssql пишу

источник

19:06пожаловаться #3

Pavel Klemenkov in Moscow Spark

Simon Osipov

.save() должен быть?

save - это action, который триггерит вычисление дага. Всё остальное - трансформации, которые только модифицируют граф вычислений

источник

19:14пожаловаться #4

Simon Osipov in Moscow Spark

Pavel Klemenkov

А разве write это не action?

источник

19:15пожаловаться #5

Pavel Klemenkov in Moscow Spark

write - это singleton, который позволяет писать в синк

источник

19:16пожаловаться #6

Pavel Klemenkov in Moscow Spark

Не action

источник

19:16пожаловаться #7

Simon Osipov in Moscow Spark

Pavel Klemenkov

write - это singleton, который позволяет писать в синк

Немного сложно для понимания, можно пояснить чуть более простым языком
?

источник

19:17пожаловаться #8

Pavel Klemenkov in Moscow Spark

write - это просто атрибут спарк сессии, который позволяет писать датафрейм во внешний сторадж. Единственный action, который запускает запись - это save

источник

19:19пожаловаться #9

Simon Osipov in Moscow Spark

Спасибо за пояснение!

источник

19:27пожаловаться #10

2019 April 10

Nikolay in Moscow Spark

Вопрос про тунгстем и columar format.в какой момент моего чтения csv файла с помощью dataframe /dataset появляется это колоночное храние данных

источник

12:25пожаловаться #11

Nikolay in Moscow Spark