Size: a a a

2021 December 29

ЕГ

Евгений Глотов... in Moscow Spark
А хайв какой?
источник

ЕГ

Евгений Глотов... in Moscow Spark
1, 2, 3?
источник

IN

Ivan Nikolaev in Moscow Spark
По моему 2
источник

ЕГ

Евгений Глотов... in Moscow Spark
LLAP с коннектором?
источник

IN

Ivan Nikolaev in Moscow Spark
Такс, пошли непонятные аббревиатуры для меня 🤷‍♂️
источник

ЕГ

Евгений Глотов... in Moscow Spark
Как чтение производится, просто spark.table(...)?
источник

IN

Ivan Nikolaev in Moscow Spark
spark.sql()
источник

ЕГ

Евгений Глотов... in Moscow Spark
А внутри 3000 строк эскуэля поверх этой вьюхи?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Насколько большой план запроса?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Я писал запросы, которые по 15 минут строятся
источник

ЕГ

Евгений Глотов... in Moscow Spark
На 3500 колонок в аутпут
источник

IN

Ivan Nikolaev in Moscow Spark
Нет, не сказать что большой, 3 джойна и 4 колонки.
источник

ЕГ

Евгений Глотов... in Moscow Spark
источник
2021 December 30

A

Albert in Moscow Spark
Здравствуйте. Подскажите пожалуйста информативные курсы или сайты для подробного изучения PySpark
источник

N

Nikita Blagodarnyy in Moscow Spark
источник

R

R in Moscow Spark
Да чего мелочиться, google.com
источник

DR

Denis Rybak in Moscow Spark
такая себе информативность
источник

A

Alex in Moscow Spark
Там норм доки + сорцы
источник

A

Alex in Moscow Spark
По другому подробно не изучить
источник

OI

Oleg Ivchenko in Moscow Spark
Переслано от Oleg Ivchenko
Физтех-школа прикладной математики и информатики МФТИ проводит однодневный интенсив по работе с файловой системой HDFS. Дата: 12.01

HDFS это часть стека Hadoop. Но и отдельно от остальных элементов стека она активно используется  т.к. обеспечивает распределенность и отказоустойчивость в хранении данных.

На интенсиве мы:
- поговорим о том что такое большие и маленькие данные и как их можно хранить
- подробно рассмотрим как устроена HDFS и как происходит чтение, запись данных. Как обеспечивается безопасность их хранения.
- поймем где именно и в каком виде система HDFS хранит данные.
- попрактикуемся с различными инструментами (например, Apache HUE) и различными API для работы с HDFS

Интенсив будет полезен как просто интересующимся BigData, так и инженерам / админам, которые работают с Hadoop. Приходите сами, приводите коллег :)
Подробнее см. на сайте интенсива: https://clck.ru/Z98Lc
источник