Size: a a a

2019 August 20

AS

Andrey SlashMan in gcp_ru
Max Kovgan
вы мониторите свое приложение изнутри?
у нас стекдрайвер, да
источник

MK

Max Kovgan in gcp_ru
надо вообще на весь kube-system внимательно посмотреть.
источник

MK

Max Kovgan in gcp_ru
и еще, тупо:
- какие инстансы (нод)
- с какими сетевухами?
источник

AS

Andrey SlashMan in gcp_ru
Max Kovgan
и еще, тупо:
- какие инстансы (нод)
- с какими сетевухами?
в кластере? минуту
источник

MK

Max Kovgan in gcp_ru
да.
источник

MK

Max Kovgan in gcp_ru
Andrey SlashMan
Привет всем! Бывали ли у кого то в GKE аналогичные проблемы: запустили в работу и наблюдаем на 30 rps к сервису периодические залипы по сети раз в 1-2 суток (резко возрастает латенси, были рандомные отказы при взаимодействии сервисов, к примеру ошибка no such host, которая сама потом потом проходила), кто-нибудь может подсказать, куда копать?
есть у кластера настройки maintenance window. посмотрите на время залипания. т.е. посмотрите на прошлые нагрузки сервисного ns во время проблемы.
источник

AS

Andrey SlashMan in gcp_ru
n1-standard-2 6 нод по 2 в каждой AZ
источник

AS

Andrey SlashMan in gcp_ru
по поводу сетевухи что-то не могу понять где это смотреть
источник

AS

Andrey SlashMan in gcp_ru
maintenance window не подошел, стоит 3 утра а залипы в основном днем, и вот вчера был в 22:00
источник

AS

Andrey SlashMan in gcp_ru
У нас такая тема: в кубернетесе стоит роутер монго дб (mongos) сами ноды монги стоят вне кубера, на gce, все началось с того, что mongos потерял пинг до нод монги и перестал роутить запросы от сервисов в кубернетесе, через полминуты переподключилось все и продолжило работать штатно
источник

AS

Andrey SlashMan in gcp_ru
то есть судя по всему какая то трабла именно с соединением во вне
источник

A

Andor in gcp_ru
именно с mongos или с чем-то ещё?
источник

AS

Andrey SlashMan in gcp_ru
нет, там было еще одно подключение к centrifugo которое так же отвалилось с подобной ошибкой (host not found)
источник

A

Andor in gcp_ru
host not found это проблема днс
источник

A

Andor in gcp_ru
проверяй логи coredns
источник

AS

Andrey SlashMan in gcp_ru
по логам в kube-dns пусто, покопался еще, увидел что стрельнуло потребление цпу у kube-proxy, именно на той ноде, с этим может быть связано?
источник
2019 September 02

v

vuzasyanin in gcp_ru
Всем привет! подскажите пожалуйста а если в аккаунте несколько проектов заводить то между ними шарятся "Скидка за обязательство по использованию" ?
источник

MK

Max Kovgan in gcp_ru
vuzasyanin
Всем привет! подскажите пожалуйста а если в аккаунте несколько проектов заводить то между ними шарятся "Скидка за обязательство по использованию" ?
аккаунт один ==> по-моему, да.
источник

MK

Max Kovgan in gcp_ru
я бы в суппорт написал для уточнения.
источник
2019 September 03

A

Anna in gcp_ru
Я тут на днях сдала Cloud Architect. Для всех кто готовится - уделите побольше внимания нетворкингу и дата стаку (BigQuery, Datalab, Dataprep).
Хорошие тесты практис - на Whizlabs.
источник