Size: a a a

2020 February 05

UD

Uncel Duk in Data Engineers
+немного чинить с админами кластер
источник

UD

Uncel Duk in Data Engineers
источник

SO

Simon Osipov in Data Engineers
Anton Shelin
я бы добавил знание форматов avro parquet ну и как графики выводить в каком нибудь superset
Графики пусть аналитики строят в табло. Avro/Parquet/ocr ну и то, "знание" это "есть такой формат, нужен когда..."
источник

AS

Anton Shelin in Data Engineers
Simon Osipov
Графики пусть аналитики строят в табло. Avro/Parquet/ocr ну и то, "знание" это "есть такой формат, нужен когда..."
Пока тот же авро изучишь хорошо поймешь схемы, миграции и зачем нужны реестры схем
источник

Д

Дмитрий in Data Engineers
Ты возможно попутал https://etcd.io/ не упомянут.
источник

DZ

Dmitry Zuev in Data Engineers
Эта шутка зашла сликом далеко
источник

ИM

И Mattermost. in Data Engineers
Uncel Duk
+немного чинить с админами кластер
Про "чинить" - как называется специализация? Когда не сайнтист, а именно админ/девупс/инженер хадупа
источник

UD

Uncel Duk in Data Engineers
И Mattermost.
Про "чинить" - как называется специализация? Когда не сайнтист, а именно админ/девупс/инженер хадупа
Ну например дс-ы напартицировали у себя 100млн файлов по 2кб
источник

UD

Uncel Duk in Data Engineers
сферические админы поймали чихающий кластер ночью
источник

UD

Uncel Duk in Data Engineers
т.е дата инжонир консультирует коллег дс-ов почему так делать не стоит и какие альтернативы возможны
источник

AG

Alexander Gorokhov in Data Engineers
Ну и переписывает с пандас на спарк
источник

SO

Simon Osipov in Data Engineers
Alexander Gorokhov
Ну и переписывает с пандас на спарк
Классика. "Нам дали ноду, там 256 GB оперативы, зачем нам Spark, там Pandas за 30 минут все считает"..
источник

IA

Ilgiz Akhmedzhanov in Data Engineers
Большое спасибо всем за ответы 🙏
источник

I

I Апрельский in Data Engineers
Now imagine an enterprise that has several thousand (or several hundred thousand) databases,
most an order of magnitude bigger than our hypothetical 10,000­field database. I once worked with a small bank that only had 5,000 employees, but managed to create 13,000 databases.


Читаю тут книжку... А сколько у вас баз?
источник

DY

Dan Y in Data Engineers
У меня тут клиент гоняет одну базу, но в ней десятки тысяч таблиц
источник

ME

Max Efremov in Data Engineers
I Апрельский
Now imagine an enterprise that has several thousand (or several hundred thousand) databases,
most an order of magnitude bigger than our hypothetical 10,000­field database. I once worked with a small bank that only had 5,000 employees, but managed to create 13,000 databases.


Читаю тут книжку... А сколько у вас баз?
У нас под каждый проект своя, в проекте под каждый енваермент и там под каждый стейдж)
источник

AG

Alexander Gorokhov in Data Engineers
I Апрельский
Now imagine an enterprise that has several thousand (or several hundred thousand) databases,
most an order of magnitude bigger than our hypothetical 10,000­field database. I once worked with a small bank that only had 5,000 employees, but managed to create 13,000 databases.


Читаю тут книжку... А сколько у вас баз?
Может тут таблицы имеются ввиду? Или в кубернетосе у каждого пода свой прицеп-контейнер с редисом.
источник

I

I Апрельский in Data Engineers
Alexander Gorokhov
Может тут таблицы имеются ввиду? Или в кубернетосе у каждого пода свой прицеп-контейнер с редисом.
вроде нет. чувак отдельно сначала говорит, что в бд может быть тысяча таблица. а потом что бд может быть много. и вот такой пример приводит))
источник

AG

Alexander Gorokhov in Data Engineers
Не а завидую я этому чуваку
источник

I

I Апрельский in Data Engineers
Это видимо какой пример для максимальной наглядности проблемы))
источник