Size: a a a

2019 July 19

A

Alexey in Data Engineers
Yukari I
У нас двоих стажеров взяли
вообще, складывается впечталение, что дата инжиниринг — это только для взрослых дядек, которые и на джаве жнец, и на администрировании игрец и в базах данных дудец, поэтому джуновых вакансий такого рода не видно от слова совсем, только синьорные. Компаниям нужны специалисты, которые могут, грубо говоря, и дата лейк поднять и инфраструктуру настроить и мониторингом всё это обложить. мне кажется, или это далеко не джуновского уровня задачи? интересно, какого уровня задачи дают на таких стажировках?
источник

LV

Lena Varlamova in Data Engineers
Alexey
вообще, складывается впечталение, что дата инжиниринг — это только для взрослых дядек, которые и на джаве жнец, и на администрировании игрец и в базах данных дудец, поэтому джуновых вакансий такого рода не видно от слова совсем, только синьорные. Компаниям нужны специалисты, которые могут, грубо говоря, и дата лейк поднять и инфраструктуру настроить и мониторингом всё это обложить. мне кажется, или это далеко не джуновского уровня задачи? интересно, какого уровня задачи дают на таких стажировках?
Вроде в питерском epam были.
источник

YI

Yukari I in Data Engineers
Alexey
вообще, складывается впечталение, что дата инжиниринг — это только для взрослых дядек, которые и на джаве жнец, и на администрировании игрец и в базах данных дудец, поэтому джуновых вакансий такого рода не видно от слова совсем, только синьорные. Компаниям нужны специалисты, которые могут, грубо говоря, и дата лейк поднять и инфраструктуру настроить и мониторингом всё это обложить. мне кажется, или это далеко не джуновского уровня задачи? интересно, какого уровня задачи дают на таких стажировках?
Эта стажировка как раз не касалась де. Это стажировка в плане обращения и использования к двх, в том числе, к даталейку
источник

VS

Vladislav 👻 Shishkov in Data Engineers
Alexey
вообще, складывается впечталение, что дата инжиниринг — это только для взрослых дядек, которые и на джаве жнец, и на администрировании игрец и в базах данных дудец, поэтому джуновых вакансий такого рода не видно от слова совсем, только синьорные. Компаниям нужны специалисты, которые могут, грубо говоря, и дата лейк поднять и инфраструктуру настроить и мониторингом всё это обложить. мне кажется, или это далеко не джуновского уровня задачи? интересно, какого уровня задачи дают на таких стажировках?
А дата инжинер причем тут?
источник

YI

Yukari I in Data Engineers
Alexey
вообще, складывается впечталение, что дата инжиниринг — это только для взрослых дядек, которые и на джаве жнец, и на администрировании игрец и в базах данных дудец, поэтому джуновых вакансий такого рода не видно от слова совсем, только синьорные. Компаниям нужны специалисты, которые могут, грубо говоря, и дата лейк поднять и инфраструктуру настроить и мониторингом всё это обложить. мне кажется, или это далеко не джуновского уровня задачи? интересно, какого уровня задачи дают на таких стажировках?
источник

Н

Никита in Data Engineers
Кто нибудь работал со sqoop через ssh tunnel или какойто proxy, pg_hba.conf не пускает с дев машины
источник

GP

Grigory Pomadchin in Data Engineers
Никита
Кто нибудь работал со sqoop через ssh tunnel или какойто proxy, pg_hba.conf не пускает с дев машины
а воркеры имеют доступ к тунелю?
источник

GP

Grigory Pomadchin in Data Engineers
где-то была статья года 2013го про это
источник

GP

Grigory Pomadchin in Data Engineers
или даже на мастере не работает ничо?
источник

GP

Grigory Pomadchin in Data Engineers
просто проблемы нет просто кинуть тунель на мастер ssh -L
источник

GP

Grigory Pomadchin in Data Engineers
но может бытьчто воркеры не имеют доступа
источник

GP

Grigory Pomadchin in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
флажок -g еще нужен будет
источник

Н

Никита in Data Engineers
спс, буду думать как это реализовать

у меня тачка airflow, у нее везде есть доступы
есть remote hadoop 10 тачек с нодами (у них нет никуда доступа)

sqoop параллелит и делает коннекшены с нод, тут появляется пробелма
источник

AZ

Anton Zadorozhniy in Data Engineers
такой туннель будет SPF и узким местом лучше все-таки разрешить соединяться с нужными базами данных из кластера (входящие при этом пусть остаются закрытыми)
источник

D

Dmitry Tron in Data Engineers
Коллеги, посоветуйте годную либу под python для работы с файловой системой HDFS
источник

D

Dmitry Tron in Data Engineers
наподобие snakebite
источник

A

Alex in Data Engineers
Люди из arrow пытались использовать
источник

АЖ

Андрей Жуков in Data Engineers
(py)arrow, в целом, норм, но он не на работу с hdfs нацелен
источник

K

KrivdaTheTriewe in Data Engineers
pyarrow
источник