Телеграмм чат группы moscowspark страница 222

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Moscow Spark

872 membersпожаловаться на группу

2019 November 24

DG

Denis Gabaydulin in Moscow Spark

Сервис на данных звучит слишком расплывчато. Что это? Интерфейс с sql к разным источникам (прозрачно для пользователя) или же просто апишечка?
Апишечка точно не сможет витрины подменить.

источник

14:41пожаловаться #1

DG

Denis Gabaydulin in Moscow Spark

MPP подменяют не из-за локальности, и даже не из-за перфоманса, а простотпотому что хадуп требует наличия программистов. А mpp часто - нет.

источник

14:45пожаловаться #2

DG

Denis Gabaydulin in Moscow Spark

А в DWH исторически, далеко не везде есть программисты (data engineers).

источник

14:45пожаловаться #3

VS

Vladislav 👻 Shishkov... in Moscow Spark

Denis Gabaydulin

А в DWH исторически, далеко не везде есть программисты (data engineers).

Сейчас табун pl/sql'щиков должен обидеться 😂

источник

14:47пожаловаться #4

DG

Denis Gabaydulin in Moscow Spark

На эту тему много говорили на data talk #1

источник

14:47пожаловаться #5

VS

Vladislav 👻 Shishkov... in Moscow Spark

Да и ETL без понимания разработки я еще не видел, если конечно не считать какое-нибудь говно

источник

14:47пожаловаться #6

VS

Vladislav 👻 Shishkov... in Moscow Spark

Ну и самое смешное, как показывает практика, меньше 50% дата инжинеров вообще понимают, что такое хранилище и как его строить

источник

14:48пожаловаться #7

AK

Alena Korogodova in Moscow Spark

Vladislav 👻 Shishkov

Сейчас табун pl/sql'щиков должен обидеться 😂

И правда обидно

источник

14:49пожаловаться #8

VS

Vladislav 👻 Shishkov... in Moscow Spark

Большинство дата инжинеров делают просто, взяли 100500 источников и переложили как есть куда-нибудь, потом обмазали на сырых данных спарком и выплюнули в витрину.
А потом бизнес/аналитик подключается каким-нибудь bi инструментом и начинает городить велосипед...

источник

14:51пожаловаться #9

DG

Denis Gabaydulin in Moscow Spark

Здесь дело не в обиде, а реальности. Если вы хотите нормальный хадуп и спарк, надо применять подходы и практики из разработки. Или придется тратить до 80% времени на инциденты и баги, на саппорт инфраструктуры.

https://speakerdeck.com/sherman/odnoklassniki-dwh-evolving-meetup-version

Odnoklassniki DWH evolving (meetup version)

источник

14:58пожаловаться #10

DG

Denis Gabaydulin in Moscow Spark

Vladislav 👻 Shishkov

Большинство дата инжинеров делают просто, взяли 100500 источников и переложили как есть куда-нибудь, потом обмазали на сырых данных спарком и выплюнули в витрину.
А потом бизнес/аналитик подключается каким-нибудь bi инструментом и начинает городить велосипед...

Плохие инженеры. Или хорошие, если все работает стабильно на существующем железе.

источник

15:01пожаловаться #11

ME

Mikhail Epikhin in Moscow Spark

А видеозапись есть?:)

источник

15:05пожаловаться #12

DG

Denis Gabaydulin in Moscow Spark

Вроде нет)

источник

15:08пожаловаться #13

ME

Mikhail Epikhin in Moscow Spark

Denis Gabaydulin

Вроде нет)

https://www.youtube.com/watch?v=btgDCH02l0Q ?

Эволюция инфраструктуры DWH в Одноклассниках – Денис Габайдулин

Секция Big Data / Data Engineering – Pain stage, 11 мая 2019
Презентации с Data Fest 6 – https://drive.google.com/open?id=1LOmOoh1WLqmhSqTKjvdOQx-YOTyBgG-i

источник

15:12пожаловаться #14

DG

Denis Gabaydulin in Moscow Spark

А это другой доклад. Это про планировщик.

источник

15:14пожаловаться #15

DG

Denis Gabaydulin in Moscow Spark

Но он тоже иллюстрирует тезис.

источник

15:15пожаловаться #16

DU

Dmitry Ursegov in Moscow Spark

Denis Gabaydulin

Здесь дело не в обиде, а реальности. Если вы хотите нормальный хадуп и спарк, надо применять подходы и практики из разработки. Или придется тратить до 80% времени на инциденты и баги, на саппорт инфраструктуры.

https://speakerdeck.com/sherman/odnoklassniki-dwh-evolving-meetup-version

Odnoklassniki DWH evolving (meetup version)

да, спасибо, тезис понятный. вообще вся эта конфа как раз по теме, жаль видео не осталось

источник

15:34пожаловаться #17

DG

Denis Gabaydulin in Moscow Spark

Но там было много примеров вполне успешных, когда люди без хадупов вполне обходятся и делают крытые штуки для бизнеса.

источник

15:43пожаловаться #18

DG

Denis Gabaydulin in Moscow Spark

Никого не хотел обедить, просто BI специалист (специалист по бизнес аналитике), data engineer, аналитик ( уклоном в продукт) это все разные скиллы, немного разная специфика. Где-то это вообще один человек, а где-то разные. Есть универсальные солдаты. Чем сложнее инфраструктура, тем больше нужно скиллов в data engineering. Hadoop-based безусловно одна из самых сложных.

источник

15:58пожаловаться #19

АЖ

Андрей Жуков... in Moscow Spark

Denis Gabaydulin

Никого не хотел обедить, просто BI специалист (специалист по бизнес аналитике), data engineer, аналитик ( уклоном в продукт) это все разные скиллы, немного разная специфика. Где-то это вообще один человек, а где-то разные. Есть универсальные солдаты. Чем сложнее инфраструктура, тем больше нужно скиллов в data engineering. Hadoop-based безусловно одна из самых сложных.

hadoop это еще не предел, вот когда тебя на s3 + kubernetes выгоняют...

источник

16:08пожаловаться #20