Телеграмм чат группы hadoopusers страница 1440

Size: a a a

Data Engineers

1724 membersпожаловаться на группу

2019 July 09

Akeel Kumar in Data Engineers

What all technology i should start with?
Please help

источник

14:14пожаловаться #1

Andrei Boaghe in Data Engineers

Alexander Chermenin

df.write
  .format("kafka")
  .option("kafka.bootstrap.servers", "host1:port1,host2:port2")
  .option("topic", "topic1")
  .save()

спасибо, но это не работает с версией спарка 2.1.0

источник

14:26пожаловаться #2

Alexander Chermenin in Data Engineers

Andrei Boaghe

спасибо, но это не работает с версией спарка 2.1.0

ну тогда либо ваш вариант, либо какая-нибудь либа, вроде https://spark-packages.org/package/BenFradet/spark-kafka-writer, либо обновить спарк :)

источник

14:46пожаловаться #3

Yukari I in Data Engineers

Это спаммер только что был

источник

22:17пожаловаться #4

Yukari I in Data Engineers

Его изо всех тематических каналов повыпиливали

источник

22:18пожаловаться #5

Grigory Pomadchin in Data Engineers

я заметил, спасибо

источник

22:18пожаловаться #6

2019 July 10

Sergey Zhemzhitsky in Data Engineers

Товарищи инженеры, кто пробовал DataProc из Яндекс.Облака?
К чему он ближе с точки зрения operations - к GC DataProc или к AWS EMR?

источник

10:32пожаловаться #7

Bogdan in Data Engineers

Для Кассандры есть бесплатные ГУИ клиенты?

источник

15:14пожаловаться #8

СХ

Старый Хрыч in Data Engineers

Bogdan

Для Кассандры есть бесплатные ГУИ клиенты?

нет

источник

15:33пожаловаться #9

СХ

Старый Хрыч in Data Engineers

но если просто посмотреть кейспейсы

источник

15:34пожаловаться #10

СХ

Старый Хрыч in Data Engineers

можно через визуалстужию код

источник

15:34пожаловаться #11

Roman in Data Engineers

Bogdan

Для Кассандры есть бесплатные ГУИ клиенты?

Есть jdbc драйвера для неё.
И есть разные клиенты, которые умеет через jdbc кастомные.

источник

15:34пожаловаться #12

Aleksey Yakushev in Data Engineers

DevCenter 1.5.0

источник

15:36пожаловаться #13

Vadim Shatalov in Data Engineers

Bogdan

Для Кассандры есть бесплатные ГУИ клиенты?

https://www.datastax.com/products/datastax-studio-and-development-tools#DataStax-Studio

DataStax: Active Everywhere, Every Cloud | Hybrid Cloud | Apache Cassandra | NoSQL

DataStax Studio and Development Tools | DataStax

DataStax Studio, Drivers, Kafka Connector, and Bulk Loader streamline distributed development of high-performance, continuously available applications in the cloud.

источник

15:42пожаловаться #14

Bogdan in Data Engineers

Спасибо

источник

15:49пожаловаться #15

Andrei Boaghe in Data Engineers

Привет всем,
Может кто помочь с интеграцией Spark/Kafka:

Надо загрузить DataFrame в Kafka (т.е передать messages).
Мы не используем Spark Streaming. Работаем со SparSQL 2.1.0.
И тут мне пришел request, что нужно иметь delay, т.е.: отрпавил 10.000 строк, жду 20 сек, отправляю дальше. Есть ли нормальный (нативный) способ сделать это, если работаю только со Spark SQL + kafka-clients? Или надо писать что-то своё?).
Ниже код, который использую сейчас:

источник

16:35пожаловаться #16

Andrei Boaghe in Data Engineers

источник

16:36пожаловаться #17

Andrei Boaghe in Data Engineers

Поможет ли Spark Streaming решить эту проблему? :)

источник

16:37пожаловаться #18

Alexander in Data Engineers

А можно вопрос: зачем новый продюсер на каждую партицую?

источник

16:42пожаловаться #19

Alex in Data Engineers

Ну выполняются то они на воркерах :) там поднялись, записали, заглушились

источник

16:43пожаловаться #20