Size: a a a

2021 June 01

AZ

Anton Zadorozhniy in Data Engineers
интересно дождемся ли мы RDS Clickhouse 😊
источник

DT

Dmitry Titov in Data Engineers
Наш altinity.cloud крутится поверх EKS и EBS и работает с помощью clickhouse-operator.
Производительность вполне неплоха и не сильно отстает от железок с локальными дисками, если бандвича EBS достаточно.
источник

AZ

Anton Zadorozhniy in Data Engineers
А есть какой-то guidance, от каких размеров имеет смысл на metal экземпляры смотреть?
источник

DT

Dmitry Titov in Data Engineers
Тут главный вопрос скорее, какой объем/процент данных будет часто использоваться.
Поместится ли он в кеш оперативной памяти.
Самые жирные инстансы вроде позволяют иметь 2-3гб/секунду для EBS, что будет достаточно для большинства пользователей.
источник

DT

Dmitry Titov in Data Engineers
У нас есть некоторые клиенты, кто крутит кликхаус поверх AWS Lustre (и своих собственных инсталляций).
Там производительность зависит уже от глубины кошелька.
источник

AZ

Anton Zadorozhniy in Data Engineers
это понятно, те кто с НРС стеком дружит - у них особенные требования и особенный бюджет
источник

DT

Dmitry Titov in Data Engineers
По проводу размеру инстансов, от 64 ядер уже имхо имеет смысл смотреть на либо железные инстансы, либо с локальными дисками.
Допустим i3.16xlarge c 8 x 1900 выглядит довольно вкусным.
источник

AZ

Anton Zadorozhniy in Data Engineers
хотя странно что не эфемеры просто, врядли FSx быстрее эфемеров в жирных инстансах
источник

AZ

Anton Zadorozhniy in Data Engineers
FSx нужен когда софт не умеет данными управлять
источник

DT

Dmitry Titov in Data Engineers
Позволю себе скопировать :)

One of our client with Lustre has ton of money they told me that they have 100 Gigabit Ethernet and it their Lustre faster than local NMVE
источник

DT

Dmitry Titov in Data Engineers
В облаках часто бывает, что быстрая сеть есть почти у всех инстансов, а вот бандвич дисков зажимают.
источник

AZ

Anton Zadorozhniy in Data Engineers
я про то и говорю, если софт не может распараллелить запись на несколько дисков - нужен быстрый внеший массив )
источник

DT

Dmitry Titov in Data Engineers
Плюс собираются добавить в кх zero replication для стораджа на NFS (а соответственно и все остальные network disks)
Уже подобное есть для S3.
источник

AZ

Anton Zadorozhniy in Data Engineers
хотя там упираются наверное уже в число этих эфемеров, у i3en их всего 8 чтоли
источник

DT

Dmitry Titov in Data Engineers
Те в перспективе shared сторадж будет дешевле, если он сам реплицирует данные внутрях.
источник

AZ

Anton Zadorozhniy in Data Engineers
а где почитать про такое для S3 в КХ?
источник

DT

Dmitry Titov in Data Engineers
https://github.com/ClickHouse/ClickHouse/pull/16240

Но оно пока экспериментальное
источник

AZ

Anton Zadorozhniy in Data Engineers
а дизайн-доков в КХ не пишут?)
источник

DT

Dmitry Titov in Data Engineers
источник

AZ

Anton Zadorozhniy in Data Engineers
ага, мне было интересно как эти все гонки будут решать, и жаль что в ЗК столько всего
источник