Size: a a a

2020 January 29

K

KrivdaTheTriewe in Data Engineers
Ну и спорно , насчёт производительности
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Ну годовой отчёт будет строить быстрее
на таких объемах данных он может джоб дольше запускать чем постгря выдаст результат
источник

K

KrivdaTheTriewe in Data Engineers
Просто там можно сразу сбоку и кластер кх по запросу подымать , и спарком чот писать
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
на таких объемах данных он может джоб дольше запускать чем постгря выдаст результат
Ну импалу
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Ну импалу
берите уж лучше терадату тогда)
источник

K

KrivdaTheTriewe in Data Engineers
Лучше когда сырые данные лежат в хадупе, а их уже  куда угодно положить можно
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
берите уж лучше терадату тогда)
Из терадаты данные не достаются и она в бекап уходит, становясь не доступной
источник

K

KrivdaTheTriewe in Data Engineers
Ну типа , закрыто
источник

AZ

Anton Zadorozhniy in Data Engineers
просто там у человека немножко данных, тормозит на постгре и он спрашивает совета чтобы построить сразу целый кластер чтобы с ними что-то делать
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Из терадаты данные не достаются и она в бекап уходит, становясь не доступной
вам виднее)
источник

K

KrivdaTheTriewe in Data Engineers
И ограничение jdbc строки в 2 мега
источник

GP

Grigory Pomadchin in Data Engineers
KrivdaTheTriewe
И ограничение jdbc строки в 2 мега
Big Data
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
просто там у человека немножко данных, тормозит на постгре и он спрашивает совета чтобы построить сразу целый кластер чтобы с ними что-то делать
Ну я не знаю размер записи
источник

VS

Vasily Shabanov in Data Engineers
ad hoc запросов нету, задача спарка/GP подготовить данные для BI, которые BI всосёт внутрь себя в собственный постгрес
источник

K

KrivdaTheTriewe in Data Engineers
Vasily Shabanov
ad hoc запросов нету, задача спарка/GP подготовить данные для BI, которые BI всосёт внутрь себя в собственный постгрес
Впринципе если там сложная аналитика , можно попробовать спарком вытянуть из постгреса и посчитать
источник

K

KrivdaTheTriewe in Data Engineers
Но это на задачах оч тяжелых какой то прирост даст
источник

VS

Vasily Shabanov in Data Engineers
аналитика достаточно сложная
источник

K

KrivdaTheTriewe in Data Engineers
Ну можно попробовать, не факт что это взлетит , но тут проверить не долго будет
источник

TY

Taras Yaroshchuk in Data Engineers
Всем привет. Задался вопросом, насколько сейчас Python популярнее или не популярнее Scala/Java для разработки Spark. Какой API вы используете для Spark?
Анонимный опрос
32%
Scala
14%
Python
11%
Java
44%
не использую Spark
Проголосовало: 420
источник

AZ

Anton Zadorozhniy in Data Engineers
а где SQLи R?
источник