Size: a a a

2021 October 06

GP

Grigory Pomadchin in Data Engineers
она не обращается к фреймам?
источник

OI

Oleg Ilinsky in Data Engineers
да, там
def flight_splitter(rows_iterator):
   for row in rows_iterator:
   base_row = row.asDict()


и пошло-поехало
источник

GP

Grigory Pomadchin in Data Engineers
тоемть ты какойнить df.select там точно не делаешь ?
источник

OI

Oleg Ilinsky in Data Engineers
не, ща ещё раз проверил - датафреймов внутри не используется
только всякие разделения строк и добавления элементов в словарь
источник

t

tenKe in Data Engineers
а этот словарь внутри функции ток существует?
источник

OI

Oleg Ilinsky in Data Engineers
да, если в кратце, то вот так

def flight_splitter(rows_iterator):
   for row in rows_iterator:
       base_row = row.asDict()



                 split_row = base_row.copy()

                 yield split_row
источник

GP

Grigory Pomadchin in Data Engineers
а чисто для примера
можешь этот флайт сплиттер убрать
источник

GP

Grigory Pomadchin in Data Engineers
и посмотреть упадет не?
источник

OI

Oleg Ilinsky in Data Engineers
ща попробую
источник

SO

Simon Osipov in Data Engineers
Какое-то время назад я просил ребят в сообществе DE заполнить маленький опрос при подготовке к докладу на TechTrain. Доклад можно посмотреть по ссылке, а вот немножко статистики из опроса (я же обещал!)

Подавляющее большинство инженеров из больших и очень больших компаний, и облаков в России немного, а большинство это on-prem компоненты. Тут все очевидно было. Как и с языком программирования: почти половина пишет на Python, 30% на Scala и всего 9% на Java. Тоже предсказуемо.

А вот неочевидное:
1) Лишь 11% ответивших считают, что самый главный технический навык это ЯП, 36% за SQL и 43% за знание тулинга и фреймворков. Литкоднинужен?😁
2) Лишь 30% сразу начали заниматься DE, все остальные - перекатывались из другой сферы.
3) Топ-5 навыков это вообще боль. За 67 ответов их набежало >35 разнообразных. Аж на слайд все не поместились.
источник

SO

Simon Osipov in Data Engineers
источник

SO

Simon Osipov in Data Engineers
источник

SO

Simon Osipov in Data Engineers
источник

SO

Simon Osipov in Data Engineers
источник

SO

Simon Osipov in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
мужество и упорство очень хороший навык
источник

SO

Simon Osipov in Data Engineers
Еще вот такой был “Понимание принципов блин даты, конкретный тулинг не важен”
источник

SO

Simon Osipov in Data Engineers
А среди топ навыков был человек-нонконформист, совершенно противоположные ответы большинству

“Алгоритмы, потом языки, потом инфра”
источник

ЕГ

Евгений Глотов... in Data Engineers
BlinData😆
источник

AS

Andrey Smirnov in Data Engineers
Возможно это был я, и t9
источник