Size: a a a

2020 December 13

SG

Silver 👻 Ghost in Sysadminka
Это для изучения и альтернативы
источник

АП

Антон [R13 🍆 Ivelok]... in Sysadminka
А кстати, @apten_fors как у вас https://www.naumen.ru/products/dap/ поживает? :)
источник

T

TSHAWYTSCHA in Sysadminka
А хрен её знает, не слышал про такую, но я слушатель тот ещё..
источник

R

Roman in Sysadminka
до отправки вопроса в чат в поисках решения я нагуглил статью которая мне показалась обоснованной, начал ковырять и оказалось что heka из статьи уже DEPRECATED. Вот и запросил живого совета в чат.
В то время как ссылки @Illusive_Echo от 2017,2018 года.
источник

АП

Антон [R13 🍆 Ivelok]... in Sysadminka
Roman
до отправки вопроса в чат в поисках решения я нагуглил статью которая мне показалась обоснованной, начал ковырять и оказалось что heka из статьи уже DEPRECATED. Вот и запросил живого совета в чат.
В то время как ссылки @Illusive_Echo от 2017,2018 года.
Ну товарищ собственно и пишет про логи
источник

АП

Антон [R13 🍆 Ivelok]... in Sysadminka
Оговорился, поправил ^
источник

АП

Антон [R13 🍆 Ivelok]... in Sysadminka
Вместо logstash сейчас вроде модно использовать vector
источник

SG

Silver 👻 Ghost in Sysadminka
Fluentbit
источник
2020 December 14

S

Slach in Sysadminka
Roman
Для мониторинга веб-сайтов на php (nginx, php-fpm, mysql, redis) и различных фреймворков (laravel, lumen, symfony и тп), а также гитлаб раннер, почтовые серверы, rocket chat (node.js + mongodb) чатик что предпочтительнее (EFK/ELK/PLG) ?
а че не в пятницу вечером?

предпочтительнее ГОЛОВА и РУКИ =)
но лично мне нравится victoria metrics + vector.dev + loki (в планах у ребят есть vmlog ;) + grafana (сцуко, если бы было можно выбрать что-то другое выбрал бы. но альтернатив свободных нет)
источник

S

Slach in Sysadminka
Roman
EFK/ELK/PLG это системы сбора логов? тогда как мониторинг это zabbix?
меня Kibana смутила - это же по сути мониторинг
пиздец  у тебя каша в голове

Kibana Это смотрелка в эластик с графиками
такая же убогая как grafana
то есть свистелок перделок много, а толка мало

мониторинг это или prometheus + alertmanager (ну может karma если вдруг от алертинга дашборды отдельные нужны будут) или zabbix
в мониторинге главное ПРАВИЛЬНЫЕ алерты (это вроде бы можно достигнуть) и правильная на них реакция (этого я пока НИГДЕ не видел за 20 лет и не знаю как этого добиваются в других местах)
иначе он бесполезен

чтобы были правильные алерты, нужны грамотно заданные по SRE показатели SLA / SLO / SLI
https://www.atlassian.com/incident-management/kpis/sla-vs-slo-vs-sli

кроме базовых алертов (типа сожрали диск, сожрали cpu, сожрали сеть, сожрали память. своп и ошибки по диску , сети, памяти и рестарты всякие)

есть еще метрики SLI выросшие из SRE, типа apdex, saturation и т.п. персентили latency

еще есть RUM метрики (монитоирнг)
еще есть мониторинг сети (типа пингуешь сам себя отовсюду, раньше я советовал https://worldping.raintank.io, но он заглох),  и RUM метрики стало модно мерять самостоятельно через какую нибудь jinba или site24x7.com

и есть еще Бизнес метрики (кол-во регистраций новых юзеров в час, кол-во заказов) для них есть balerter
источник

АП

Антон [R13 🍆 Ivelok]... in Sysadminka
источник

r

raven428 in Sysadminka
Slach
пиздец  у тебя каша в голове

Kibana Это смотрелка в эластик с графиками
такая же убогая как grafana
то есть свистелок перделок много, а толка мало

мониторинг это или prometheus + alertmanager (ну может karma если вдруг от алертинга дашборды отдельные нужны будут) или zabbix
в мониторинге главное ПРАВИЛЬНЫЕ алерты (это вроде бы можно достигнуть) и правильная на них реакция (этого я пока НИГДЕ не видел за 20 лет и не знаю как этого добиваются в других местах)
иначе он бесполезен

чтобы были правильные алерты, нужны грамотно заданные по SRE показатели SLA / SLO / SLI
https://www.atlassian.com/incident-management/kpis/sla-vs-slo-vs-sli

кроме базовых алертов (типа сожрали диск, сожрали cpu, сожрали сеть, сожрали память. своп и ошибки по диску , сети, памяти и рестарты всякие)

есть еще метрики SLI выросшие из SRE, типа apdex, saturation и т.п. персентили latency

еще есть RUM метрики (монитоирнг)
еще есть мониторинг сети (типа пингуешь сам себя отовсюду, раньше я советовал https://worldping.raintank.io, но он заглох),  и RUM метрики стало модно мерять самостоятельно через какую нибудь jinba или site24x7.com

и есть еще Бизнес метрики (кол-во регистраций новых юзеров в час, кол-во заказов) для них есть balerter
Почему prometheus + alertmanager, а не victoria metrics + vmalert?

Остальное разжевал хорошо, я аж сохранил, пригодится )
источник

S

Slach in Sysadminka
raven428
Почему prometheus + alertmanager, а не victoria metrics + vmalert?

Остальное разжевал хорошо, я аж сохранил, пригодится )
да, наверное vmagent + vm будут получше =) масштабируются лучше
это просто для меня синонимы прометеуса сейчас, у меня просто с ними еще опыта мало
источник

T

TSHAWYTSCHA in Sysadminka
» правильная на них реакция (этого я пока НИГДЕ не видел за 20 лет и не знаю как этого добиваются в других местах)

Это как?
источник

r

raven428 in Sysadminka
TSHAWYTSCHA
» правильная на них реакция (этого я пока НИГДЕ не видел за 20 лет и не знаю как этого добиваются в других местах)

Это как?
Всем похер )
источник

T

TSHAWYTSCHA in Sysadminka
Странно
источник

T

TSHAWYTSCHA in Sysadminka
у нас на клиентах даже мониторинг+алертинг есть, с авто созданием запросов разного приоритета.
источник

T

TSHAWYTSCHA in Sysadminka
но там хотя понятно, у людей саппорт платный ))
НО и внутри админского отдела есть мониторинг и алертинг, и на алерты всегда есть реакция
источник

S

Slach in Sysadminka
TSHAWYTSCHA
» правильная на них реакция (этого я пока НИГДЕ не видел за 20 лет и не знаю как этого добиваются в других местах)

Это как?
это так
приходишь, делаешь мониторинг, убиваешь на это дохера времени, настраиваешь
и потом начинается "ой, а чО так часто этот алерт?" "а давайте уберем"
без какой либо реальной реакции
ну то есть вот глючит какой то эндпоинт, но не смертельно, жить не мешает
давайте не будем тратить на это время...

и пиздец
в итоге это все кончается тем что "ой, у нас тут мастер-слейв оказывается развалился и разъехался, давайте восстанавливаться из бекапов, ой бекапы чето битые"
и ты такой ебана в рот джедай хуячишь через xbstream + xtrabackup стриминговую копию мастера на пол терабайта...
и тебя же потом в простое обвиняют =)

конкретно у меня так было уже 2 раза
сейчас возможно будет третий. но не факт
источник

S

Slach in Sysadminka
TSHAWYTSCHA
у нас на клиентах даже мониторинг+алертинг есть, с авто созданием запросов разного приоритета.
и чО как??? ты в цифрах можешь показать
сколько issue создали?
сколько закрыли с РЕАЛЬНЫМИ исправлениями и улучшениями?
источник