Size: a a a

2019 September 18

DB

Daniil Berdnikov in Data Engineers
В целом, с SQL работаю около 2-х лет, но это опыт исключительно с одной СУБД, так вышло=)
источник

AZ

Anton Zadorozhniy in Data Engineers
Daniil Berdnikov
Позиция будет Data Engineer (с учётом обучения)

Ранее писал отчёты, сейчас, на текущем месте - проектирование БД, её наполнение, триггеры, хранимые процедуры, оптимизация через рефакторинг и план выполнения
источник

DB

Daniil Berdnikov in Data Engineers
Спасибо, сегодня начну
А что могли бы ещё посоветовать для начала? Понятно, что на новом месте будут учить, но всё же
источник

AZ

Anton Zadorozhniy in Data Engineers
Daniil Berdnikov
Спасибо, сегодня начну
А что могли бы ещё посоветовать для начала? Понятно, что на новом месте будут учить, но всё же
уверен что вам все расскажут, а перед новой работой лучше всего отдохнуть :)
источник

DB

Daniil Berdnikov in Data Engineers
Anton Zadorozhniy
уверен что вам все расскажут, а перед новой работой лучше всего отдохнуть :)
Стандартное волнение перед новой работой никуда не денется, поэтому и начал задавать такие вопросы

Спасибо большое, отдохнуть и правда не помешает:)
источник

AZ

Anton Zadorozhniy in Data Engineers
Daniil Berdnikov
Стандартное волнение перед новой работой никуда не денется, поэтому и начал задавать такие вопросы

Спасибо большое, отдохнуть и правда не помешает:)
могу сказать что это обычная РСУБД, особенности вы врядли детально сможете обозреть за ограниченное время, а у вашего нового работодателя наверняка есть какой-то онбординг на эту тему, я бы доверился ему)
источник

DB

Daniil Berdnikov in Data Engineers
Я думал вообще просто освежить память об алгоритмах и их оптимизации, на больших данных может пригодиться, нет?:)
Кстати, можете посоветовать и по этой теме что-то?
источник

M

Mi in Data Engineers
Мне кажется просто погуглите общую информацию на тему терадаты
источник

M

Mi in Data Engineers
и общие подходы в бигдате
источник

M

Mi in Data Engineers
всё равно без конкретной цели сильно не втянешься
источник

M

Mi in Data Engineers
особенно когда понятия не имеешь какие будут конкретные цели
источник

DB

Daniil Berdnikov in Data Engineers
Полагаю, я ещё вернусь с конкретными вопросами через пару недель:D
источник

AZ

Anton Zadorozhniy in Data Engineers
Daniil Berdnikov
Я думал вообще просто освежить память об алгоритмах и их оптимизации, на больших данных может пригодиться, нет?:)
Кстати, можете посоветовать и по этой теме что-то?
что-то специальное про ТД я не смогу порекомендовать, это очень обычная СУБД на мой вкус (таких много то есть), различия там в деталях, а так просто популярные теперь книжки не будут вредными, вроде DDIA
источник

DB

Daniil Berdnikov in Data Engineers
Понял
Всем спасибо огромное, потом ещё приду с вопросами по конкретике)
источник

N

Nikita Blagodarnyy in Data Engineers
Daniil Berdnikov
Понял
Всем спасибо огромное, потом ещё приду с вопросами по конкретике)
Почитайте общие сведения о технологиях Massive Parallel Processing, Driver/Executor, парадигмах Shared Nothing/Shared Everithing. Что такое amp, что такое map join, что такое data skew, что такое грязные чтения.
источник

N

Nikita Blagodarnyy in Data Engineers
У меня с курсов по SQL/physical design версии осталось килограмм 15 студент гайдов, я свято верю, что когда-нибудь на досуге прочитаю их целиком. Если Вы из Питера-берите почитать :)
источник

DB

Daniil Berdnikov in Data Engineers
Nikita Blagodarnyy
У меня с курсов по SQL/physical design версии осталось килограмм 15 студент гайдов, я свято верю, что когда-нибудь на досуге прочитаю их целиком. Если Вы из Питера-берите почитать :)
К сожалению, Москва)
Но, если есть в файловом варианте - с удовольствием бы зачитался)
источник

IL

Ivan Levitsky in Data Engineers
Добрый день, коллеги
Подскажите пожалуйста
Я правильно понимаю, что на датанодах хадупа, нагрузка на дисковую подсистему в основном это последовательное чтение\запись и мало случайного чтения\записи?
источник

UD

Uncel Duk in Data Engineers
Ivan Levitsky
Добрый день, коллеги
Подскажите пожалуйста
Я правильно понимаю, что на датанодах хадупа, нагрузка на дисковую подсистему в основном это последовательное чтение\запись и мало случайного чтения\записи?
пока кто-то не шафлится
источник

UD

Uncel Duk in Data Engineers
источник