Size: a a a

2019 November 21

С

Сюткин in Moscow Spark
Переслано от Сюткин
источник

С

Сюткин in Moscow Spark
Переслано от Сюткин
источник

С

Сюткин in Moscow Spark
Кратко, кому лень смотреть
источник

TZ

Timur Zalimov in Moscow Spark
Где потом можно презентации взять ? Что на spark moscow ...
источник

GP

Grigory Pomadchin in Moscow Spark
Timur Zalimov
Где потом можно презентации взять ? Что на spark moscow ...
все будет
источник

TZ

Timur Zalimov in Moscow Spark
Спасибо )
источник

GP

Grigory Pomadchin in Moscow Spark
А традиционно - ссылка вот http://bit.ly/moscow_spark_slides
источник

SO

Simon Osipov in Moscow Spark
У Амазон в гитхабе есть https://github.com/awslabs/deequ - штука для data unit tests.

Что-то похожее на питончике кто-нибудь видел?
источник

IG

Igor Gorbenko in Moscow Spark
Simon Osipov
У Амазон в гитхабе есть https://github.com/awslabs/deequ - штука для data unit tests.

Что-то похожее на питончике кто-нибудь видел?
Спасибо, интересная тема!
источник

K

KrivdaTheTriewe in Moscow Spark
Simon Osipov
У Амазон в гитхабе есть https://github.com/awslabs/deequ - штука для data unit tests.

Что-то похожее на питончике кто-нибудь видел?
Лучше скалу использовать
источник

SO

Simon Osipov in Moscow Spark
KrivdaTheTriewe
Лучше скалу использовать
Я то как раз хочу Скалу, но мне надо убедить остальных, что ничего хорошего на питончике нет, поэтому дайте я сделаю это на Скале)
источник

A

Andrey_Pro in Moscow Spark
KrivdaTheTriewe
Лучше скалу использовать
А на скале кроме лог рега что то есть?
источник

С

Сюткин in Moscow Spark
Хоть знаю теперь как Кривда вживую выглядит
источник

DG

Denis Gabaydulin in Moscow Spark
Просто мнение. Не очень понятно откуда взялось утверждение, что тренд на локалити уходит. Я бы сказал наоборот. Базы данных-то как раз (мпп), которые подменяют хадуп-спарк это все суперлокальные решения. Вычисления макс близко к данным. Я так-то хадуп не защищаю, но кажется что спарк в кубере поверх s3, это шаг назад. Уж лучше проприетарная облачная платформа.
источник

DG

Denis Gabaydulin in Moscow Spark
А когда мы доберемся до гпу, этот тренд еще более станет актуален.
источник

DG

Denis Gabaydulin in Moscow Spark
Потому что IO это все еще значительная часть волклока в джобе.
источник

K

KrivdaTheTriewe in Moscow Spark
Ребят где афтерпати
источник

ЕГ

Евгений Глотов... in Moscow Spark
Denis Gabaydulin
Просто мнение. Не очень понятно откуда взялось утверждение, что тренд на локалити уходит. Я бы сказал наоборот. Базы данных-то как раз (мпп), которые подменяют хадуп-спарк это все суперлокальные решения. Вычисления макс близко к данным. Я так-то хадуп не защищаю, но кажется что спарк в кубере поверх s3, это шаг назад. Уж лучше проприетарная облачная платформа.
Проприетарные платформы лучше для разработчиков, которые будут переносить это обратно на хадуп😆👍
источник

ЕГ

Евгений Глотов... in Moscow Spark
Andrey_Pro
А на скале кроме лог рега что то есть?
Xgboost on spark, mmlspark
источник

ЕГ

Евгений Глотов... in Moscow Spark
Бустец в общем
источник