Size: a a a

2021 May 19

EM

Egor Mateshuk in Data Engineers
пардон проглядел
источник

EM

Egor Mateshuk in Data Engineers
похоже, что памяти не хватает. открутите у докера лимит по памяти
источник

AE

Alexey Evdokimov in Data Engineers
ловушка средних доходов
источник

AE

Alexey Evdokimov in Data Engineers
проект вышел на прибыль, но её мало для дальнейшего развития. ни людей на постоянку не нанять, ни постоянные расходы на инфру не запланировать. вот купил бы нас кто-нить большой...
источник

A

Aleksandr in Data Engineers
всем привет. подскажите, пожалуйста, где можно в полной мере прочитать и понять про
"main compression formats and their corresponding codecs"
источник

IS

Ilia Stepanov in Data Engineers
Всем, привет!
Из хадупа выгружаю текстовые данные (новости) через pyspark и перевожу их в пандас датафрейм. Из-за \n и \r в тексте улетают строки - переносятся в новую отдельную запись. При удалении этих символов - все ок, но текст отображается сплошником без переноса строки. Подскажите, пожалуйста, как выгрузить текст корректно и не потерять перенос строки?
источник

RI

Rustam Iksanov in Data Engineers
А где отображается текст?
источник

IS

Ilia Stepanov in Data Engineers
В jupyter после to_pandas
источник

RI

Rustam Iksanov in Data Engineers
"красивый" вывод в юпитер делал через html, может вам попробовать заменить \r -> <br>
источник

IS

Ilia Stepanov in Data Engineers
Ок, спасибо
источник

AM

Artem Muravlev in Data Engineers
Ура, увеличение памяти помогло, спасибо!
источник

AM

Artem Muravlev in Data Engineers
Увеличивал на самом ярне, почему то Узи хотел кушать около более 10.6 гб для своего контейнера!

Немного странно что так много, как уменьшить размер контейнера Узи не нашел( Если ставлю максимальный размер контейнера в Ярне меньше 5.3 Гб в логах Узи ругается что ему не хватает места(((
источник

AE

Andrey E in Data Engineers
Прямо основательно в одном месте не видел, нужно собирать по разным источникам. Можно начать с Hadoop. Definitve guide. Там отдельная глава поверхностно про compression
источник

С

Сюткин in Data Engineers
@pomadchin тут халтура есть, мб бессрочный?
источник

GP

Grigory Pomadchin in Data Engineers
ага
источник

K

KrivdaTheTriewe in Data Engineers
А что там не так , мы даж се энтркпрайз сделали
источник

K

KrivdaTheTriewe in Data Engineers
Гитлаб заюзайте и счастье вам будет
источник

K

KrivdaTheTriewe in Data Engineers
Хей! Всем привет!)

Мы потихоньку начинаем наш подкаст Дата Сплетни!
Тематика: СобесыСобесыСобесы


Наша фирма "DataJobs Industries" в поисках датаинженера DWH - мастера на все руки, золотой человека, который решит большую часть проблем и построит хранилище с нуля


Знакомьтесь с нашей командной:
Директор по персоналу - @flymemary
и три технических директора
* @nblagodarnyy
* Евгений
* @bakanchev

мы выбрали одного кандидата, который подходит на позицию senior DE
необходимо его прособесить и проверить софт\хард скиллы

резюме кандидата прикрепляю

Формат мероприятия:
1. Войсчат будет проходить в ТГ, кодинг кандидата с задачами по ссылке
https://ya.cc/t/g3QP5VmnWKCLX

2. Обсуждение поcле (как лучше подготовиться к резюме, самые необычные собесы в вашей практике, собесы в европу, почему не стоит прекращать ходить по собесам даже во время работы, полезные ссылки на материалы подготовки к собесам)
источник

K

KrivdaTheTriewe in Data Engineers
Подкаст началчЯ, присоединяйтесь
источник
2021 May 20

AE

Alexey Evdokimov in Data Engineers
любим мы тут похоливарить про жабу и не жабу иногда, верно?
источник