Size: a a a

2021 June 10

K

KrivdaTheTriewe in Data Engineers
что мне делать то
источник

AZ

Anton Zadorozhniy in Data Engineers
тут периодически пробегают люди которые спрашивают почему SQL в Ignite работает медленно)
источник

K

KrivdaTheTriewe in Data Engineers
если нужно в хадупе
источник

N

Nikita Blagodarnyy in Data Engineers
ну а что, игнайт вон какой хороший
источник

AZ

Anton Zadorozhniy in Data Engineers
nobody's perfect
источник

N

Nikita Blagodarnyy in Data Engineers
а что бы ты хотел сделать в спарке с этим блобом? просто переложить? если бы он вынимался, например.
источник

AB

Anatoly B in Data Engineers
я это даже не трогал, только в дипломной работе упоминал) но судя по архитектуре оно и не могло работать быстро
источник

K

KrivdaTheTriewe in Data Engineers
я думал я уволюсь в тот момент
источник

K

KrivdaTheTriewe in Data Engineers
корчое, если можно сделать составной ключ без этого поля, то проблема решаема
источник

S

Stanislav in Data Engineers
От обьемов и типа сырья зависит. Если вы около айти продуктов, то у вас сплошные клик стримы с мало джйонов, можно успешно зайти в кликхауз. Пример иви. Если вы в энтепрайзе с кучей реляционок, берите мпп типа гп. Хадуп - у вас или очень много данных, или вам нужен обжект стор и вы понимаете почему аналитики будут плакать от хайва и спарка
источник

S

Stanislav in Data Engineers
Хотя даже от вертики можно поплакать, чо там
источник

AZ

Anton Zadorozhniy in Data Engineers
архитектурно Firebolt самое многообещающее хранилище, в плане ресурсов пушить свою повестку Databricks круче всех, а адепты открытого кода тихонько ждут когда iceberg станет мазаться на хлеб
источник

DZ

Dmitry Zuev in Data Engineers
Заклинаю вас, не делайте даталейк на вертике. Проще блядь научить ребенка программировать
источник

AB

Anatoly B in Data Engineers
ахаха vertica никогда :) я как коммитер в кликхаус идейно против
источник

AZ

Anton Zadorozhniy in Data Engineers
даталейк вообще обычно делают в объектном сторадже, реляционки появляются для детального слоя, или уже как витрины (если независимые витрины)
источник

AZ

Anton Zadorozhniy in Data Engineers
кликхаус как система для витрин с несложным SQL наверное норм (правда наши тесты он никак не проходит пока, ждем улучшения поддержки языка)
источник

SS

Sergey Sheremeta in Data Engineers
А какие у вас тесты?
источник

AZ

Anton Zadorozhniy in Data Engineers
мы гоняем tpch/tpcds и еще всякую мелочь через tdbench
источник

AB

Anatoly B in Data Engineers
а как витрины делаете? у нас тут гугловский Looker хотят прикрутить, честно говоря мне кажется та ещё приблуда, до него metabase жил)
источник

AZ

Anton Zadorozhniy in Data Engineers
все стандартный SQL, причем без каких-то относительно свежих наворотов вроде темпоральных, условно SQL 2006-2008
источник