Size: a a a

2021 May 13

AE

Alexey Evdokimov in Data Engineers
неееее, явно чё-нить другое сожрёт весь этот модный мл. прогнозы строить дело неблагодарное
источник

ЕГ

Евгений Глотов... in Data Engineers
Эскуэль никуда не денется)
источник

AE

Alexey Evdokimov in Data Engineers
эскуэль всего лишь язык для написания предикатов
источник

AZ

Anton Zadorozhniy in Data Engineers
да, это похоже на разговоры просветленных в конце нулевых, что "мапредьюс настолько гибче, кому этот сиквел нужен, его время прошло"
источник

AZ

Anton Zadorozhniy in Data Engineers
омг, я чуть не свалился со стула, осторожнее шутить надо)
источник

AE

Alexey Evdokimov in Data Engineers
пусть цветут все цветы и каждому инструменту свои задачи. а ultimate chicken horse doesn't exist
источник

AE

Alexey Evdokimov in Data Engineers
Ж)
источник

N

Nikita Blagodarnyy in Data Engineers
или нет. если их неправильно использовать.
источник

A

Alex in Data Engineers
привет, какого максимального размера значение можно засунуть в Spark DF колонка ArrayType ? какие там существуют ограничения ?
источник

IK

Ilya Kozyrev in Data Engineers
Всем привет. Рабоем с Apache Kafka и подгружаем keystore и truststore с облачного стораджа, а потом конфигурируем консьюмер. Иногда вылезает ошибка
Failed to load SSL keystore /tmp/kafka.truststore.jks of type JKS
Caused by: java.io.IOException: DerInputStream.getLength(): lengthTag=65, too big.
Кто-то сталкивался? И имеет ли значение формат файла серта? Мы и PKCS12 и JKS сохраняем локально в .jks файлы. Кафке возможно не пофиг на это?
источник

АБ

Артемий Богданов... in Data Engineers
есть датасет, как сделать, чтобы каждое значение было отдельной колонкой?
источник

АР

Андрей Романов... in Data Engineers
Explode такой структуры может помочь

Вот тут есть примеры
https://sparkbyexamples.com/spark/explode-spark-array-and-map-dataframe-column/
источник

АР

Андрей Романов... in Data Engineers
источник

АБ

Артемий Богданов... in Data Engineers
Спасибо, пойду изучать)
источник

KS

K S in Data Engineers
Кто-нибудь хочет заработать  500 долларов за участие в опросе?
источник

KS

K S in Data Engineers
Прислали вот такой спам, если кому-то интересно - читайте.

Hope you're doing well. I’m working with a client, an investor, looking to set up a $500 hour-long compensated call to discuss Data Pipeline Providers, specifically looking into Airflow, Prefect, DBT, Starburst, Fivetran, and Census.   


They're looking to speak with customers and experts that are familiar with these solutions. I came across your LinkedIn profile and thought you would be a great person to speak with given your experience.  

 

This would be a 45-60min call with the client. We are, of course, happy to compensate you at whatever rate makes an hour of your time worthwhile!

 

Let me know if you're interested and I can send you the screening questions along with more details. If you prefer to hop on a quick phone call just let me know your best phone number!

 

 

Best,

Blair

Blair Arnell
Analyst


120 S LaSalle #1800, Chicago, IL 60602

Tel +1 219 309 8729  |  Website www.tegus.co
источник

ME

Max Efremov in Data Engineers
Прекрасное, в конторе спецов не нашлось, но мы готовы заплатить кому-то, чтобы поговорили с нашими клиентами и показали экспертизу?
источник

KS

K S in Data Engineers
Они наверное хотят валидировать стартап, который пытается получить инвестиции. Поэтому нужен специалист или даже несколько профи, которые скажут что да это крутая идея.
источник
2021 May 14

G⚔

Gennady ⚔ in Data Engineers
😂
источник

R

Robert'); DROP TABLE... in Data Engineers
Всем привет. Выбираю себе Data Warehouse. Хочу туда стримить изменения из БД в микросервисах через кафку.
Думаю между Redshift, Google BigQuery и Snowflake.

Кто-нибудь может подсказать, какие затраты по последним двум могут быть, чтобы запилить прототип (пара сотен GB данных сторейджа + нечастые аналитические запросы + частые обновления отдельных записей)?
С редшифтом всё понятно, потому что платишь за инфру, а с этими двумя с их pay-as-you-go я запутался.
источник