Size: a a a

2021 June 01

GP

Grigory Pomadchin in Data Engineers
но если ты про testcontainers-hdfs то он у меня поднимает локально контейнер
источник

N

Nikita Blagodarnyy in Data Engineers
Хочешь видео запишу.
источник

N

Nikita Blagodarnyy in Data Engineers
А как мне hdfs операции тестировать? Как отцы завещали, так и делаю.
источник

GP

Grigory Pomadchin in Data Engineers
а в логах чо
источник

GP

Grigory Pomadchin in Data Engineers
када стартуешь
источник

GP

Grigory Pomadchin in Data Engineers
там ж он пишет типа алоцировал контейнер
источник

GP

Grigory Pomadchin in Data Engineers
такой то адрес имя
источник

N

Nikita Blagodarnyy in Data Engineers
Поищу. Там конская простынь, ещё же спрак локально заводится. Я ради интереса ставил просто while true и шёл смотреть докер пс, а там пусто.
источник

im

ibtoey mnapt in Data Engineers
https://t.me/MacSoftwareFree/57
This is a channel that focuses on Mac free cracking software. They are free forever and are updated weekly.
источник

C

Combot in Data Engineers
ibtoey mnapt has been banned! Reason: CAS ban.
источник

RY

Ruslan515 Y in Data Engineers
Добрый день.
1. есть большой фрейм. нужно создать текстовый столбик, куда будут внесены в тестовом виде данные по заданной строке, который будет представлять для каждой строки "название столбца: содержимое данного столбца". т.е. к примеру фрейм имеет столбцы - a, b, c, d. нужен отдельный столбец text для текстового представления столбиков c, d. к примеру для строки с индексом i: df.loc[i, "text"] == "c: text1, d: text2". где text1 == df.loc[i, "c"], text2 == df.loc[i, "d"].
если использовать простую итерацию по индексам, а затем по столбикам, то время будет измеряться часами. нужно сделать как можно быстрее?
я вот такой код использую
       for index, row in df.iterrows():
           text = ""
           for col in target_cols:
               text += dict_name[col]
               text += ": "
               text += str(row[col])
               text += "."
           # row["text"] = text
           df.loc[index, "text"] = text
2. возникает проблема в размере файла. т.к. он большой то в память не влазит. возможно конечно считвание по частям и дозапись, но может есть другие способы?
источник

GA

Galaydyuk Alexander in Data Engineers
Коллег привет! Есть какие-нибудь решения, что бы из большого sql-кода truncate,insert’ов генерировало несложную визуализацию потока преобразований, содержащую название таблиц и списка полей, используемых в коде. Что погуглить на этот счёт?
источник

GA

Galaydyuk Alexander in Data Engineers
Кажется, что ничего сложного, может в python библиотека уже есть. Но гугл выдает курсы визуализации данных с помощью питон
источник

AZ

Anton Zadorozhniy in Data Engineers
источник

МК

Михаил Королев... in Data Engineers
да, и имя ему - apache spark...
источник

MG

Maxim Grankin in Data Engineers
Всем привет, может кто-то дать ссылку на тематический чат по кафке?
источник

JF

Jane Frankenstein in Data Engineers
привет, https://t.me/proKafka
источник

MG

Maxim Grankin in Data Engineers
Спасибо!
источник

K

KrivdaTheTriewe in Data Engineers
коллеги, кто трино разворачивал, у  меня добрались руки наконец, как вы делали POC для ононодового кластера)
источник

K

KrivdaTheTriewe in Data Engineers
есть ли  какие-нибудь доп тулзы(BI) , которые позвуолят это продать как красивую он премиз историю, и еще вопрос, в кубе или не в кубе прод делать, если делать
источник