Size: a a a

Пятничный деплой

2021 March 08
Пятничный деплой
Cortex и не только: распределённый Prometheus

В последнее время Prometheus стал де-факто стандартом для сбора и хранения метрик. Он удобен для разработчиков ПО - экспорт метрик можно реализовать в несколько строк кода. Для DevOps/SRE, в свою очередь, есть простой язык PromQL для получения метрик из хранилища и их визуализации в той же Grafana.

Но Prometheus имеет ряд недостатков, способы устранения которых я хочу рассмотреть в этой статье. Также разберём деплой Cortex - распределённого хранилища метрик. Читать дальше.
источник
2021 March 09
Пятничный деплой
источник
Пятничный деплой
скандалыинтригирасследования
источник
Пятничный деплой
Крутая история о том, как не надо делать find_by_sql в Rails. С вишенками на торте:

- Через SQL injection увели 70Гб данных пользователей «фейсбука для alt-right», платформы Gab, включая аккаунт Трампа.

- Автор кода — CTO платформы, и он пытался скрыть следы, удалив свой коммит. Скриншоты коммита — в  статье.

Читать: http://amp.gs/QraI
источник
2021 March 10
Пятничный деплой
«PostgreSQL: replication, backup and observability» — курс от Слёрм.

Курс подойдёт тем, кому не хватает практических навыков для работы с PostgresSQL. А так же тем, кто хочет научиться грамотно действовать в критических ситуациях и принимать быстрые и взвешенные решения по обеспечению работоспособности кластера.

Программа курса основана на реальных задачах команд эксплуатации, а сам курс на 75% состоит из практики.

❗️На занятиях мы научим архитектурным решениям, вместе поднимем их в тестовой среде.

🎙Автор и спикер курса — Иван Чувашов | Ведущий инженер OKKO, Администратор баз данных Southbridge.

Даты проведения: 6-21 апреля, занятия будут проходить по вторникам и четвергам с 19:00 до 22:00 (мск).

Стоимость — 30 000 рублей.
Посмотреть программу и записаться: https://slurm.club/3ea4dz0
источник
Пятничный деплой
Тут это, ансибл 3.0 вышол

https://www.ansible.com/blog/announcing-the-community-ansible-3.0.0-package

#ansible
источник
2021 March 11
Пятничный деплой
Опенсорс-бот, который поможет базово трекать SLA в хелпдесках

https://habr.com/ru/company/skyeng/blog/545708/

#slack #sla #bot #hepldesk
источник
Пятничный деплой
Engineering dependability and fault tolerance in a distributed system

https://ably.com/blog/engineering-dependability-and-fault-tolerance-in-a-distributed-system
источник
Пятничный деплой
Good news, everyone!
источник
Пятничный деплой
Новый сервис Yandex Cloud DNS вышел в стадии Preview

С Cloud DNS вы можете управлять ресурсными записями и доменными именами из облака и настраивать внутренние и публичные DNS-зоны в консоли, API, CLI и Terraform.

Сервис упростит делегирование доменов и позволит создавать разные окружения внутри вашего проекта без вложений в собственные DNS-сервера.

Подробнее в блоге →

#ycloud_news
источник
Пятничный деплой
#машины_разное

Неплохо так бомбануло вчера, да? Честное слово, еще одна авария из-за регулярок (я все еще помню историю с Cloudflare), и я всерьез задумаюсь о выходе из профессии.

Обещанное про TCP и его возможности. Я уверен, вы догадались, что речь пойдет не о рукопожатиях (вы их и без меня знаете, а если не знаете, то срочно идите знать), но про TCP backlog, window, qdisc и прочие прелести, о которых я узнал вот буквально в этом году.

Век живи.

Узнал я про них не абы откуда, а из второго издания Systems Performance Брендана Грегга (которого вы знаете как парня, любящего покричать на диски). Производительность сети вообще несправедливо игнорируемая тема: новое поколение инженеров предпочитает закидывать проблему ресурсами, старое поколение винит во всем сетевиков, либо знает, что сеть можно тюнить на уровне сетевой подсистемы Linux Kernel (эти ребята штучный товар и сидят конечно же в FAANG’ах).

У TCP есть backlog - очередь из сегментов на обработку, каждому порту назначается своя очередь, если эта очередь забивается (tcp congestion), то пакеты начинают теряться. Для управления перегрузкой используются так называемые “алгоритмы избежания сетевой перегрузки” (их много). Сама подсистема использует всякие трюки в виде congestion windows и slow start.

Но управление очередью это еще полбеды. Каждое соединение требует рукопожатия, что на больших объемах негативно влияет на пропускную способность сети. Если сетка у нас уморительно стабильна и каждое соединение успешно “рукопожимается”, то накрутить оборотов можно с помощью TCP initial/receive window. Эти два подхода позволяют добавить небольшой асинхронности сетевой передаче, отправляя и принимая часть сегментов прежде, чем ответить ACK’ом. В довесок к этому есть еще SACK и TCP timestamps - результат схожий, принцип работы несколько другой.

Что еще есть прикольного в этой вашей сетке? TCP/Generic Segment Offloading. Ядро генерирует super packet размером до 64 Кб, который затем нарезается на сегменты непосредственно перед отправкой на сетевой устройство (GSO). Современные сетевые карты могут делать это сами (TSO), так что ядро даже этим не заморачивается.

Ну и напоследок - queueing discipline или qdisc. Qdisc работает на L2-L3 и является планировщиком отправки пакетов/кадров. По умолчанию используется FIFO, но возможностей там гораздо больше, даже есть Token bucket.

В книге Грегга, кстати, есть старый кусок сетевой конфигурации, которая раньше использовалась в Netflix.
источник
Пятничный деплой
Мощный мониторинг за пять минут с помощью Glances

Допустим, что у нас не очень обширная инфраструктура: несколько небольших VPSок, подкроватник, NAS и два ноутбука, торчащих в сеть. Тем не менее, за ней всё равно надо приглядывать, и заниматься этим вручную раздражает всё больше с каждой новой машиной. Я стал искать систему мониторинга, которая могла бы не съедая лишних ресурсов агрегировать информацию отовсюду в единый дашборд, желательно без геморроя с настройкой. Читать дальше.
источник
Пятничный деплой
Нещадин Иван из Авито рассказывает про оптимизацию микросервиса на Go.

https://proglib.io/w/7e7a6022
источник
Пятничный деплой
Рад сообщить, что мой доклад "Kubernetes: Трансформация к SecDevSecOpsSec" был принят на конференцию DevOpsConf 2021. Конференция пройдет в offline формате в Москве 30 и 31 мая. Так что будет прекрасная возможность пообщаться лично)

В основном, речь в докладе пойдет о том, как Kubernetes позволяет отлично управлять угрозами (Identify, Protect, Detect, Respond, Recover, Deception) и организовывать эшелонированную оборону.  Также затрону: DevSecOps, SSDL, Shift Left/Everywhere Security, OODA, SOAR, ZeroTrust, Self-protecting. Доклад будет полезен как Security специалистам, так DevOps специалистам, работающим с Kubernetes и позволит одинаково видит проблемы, пути решения и возможности этого в Kubernetes.

__P.S. Данный доклад я должен был еще прочитать в конце прошлого года, но мероприятия были отменены.__
источник
2021 March 12
Пятничный деплой
⚡️ Линус Торвальдс отправил срочное сообщение в мейллист. Он категорически не советует людям устанавливать недавнее dev ядро Linux 5.12-rc1; особенно тем, кто использует swap файлы (а не разделы).

"Я хочу, чтобы все знали об этом, потому что если он [linux] укусит вас, он укусит вас сильно, и вы можете получить испорченную файловую систему, которая по существу будет перезаписана случайными данными подкачки."

Кроме того, Линус просит мейнтейнеров не форкать ветку 5.12-rc1, чтобы избежать будущих ситуаций, когда новые версии ядра будут основаны на неисправном и очень опасном.

#breakingnews #покаготовимвыпуск
источник
2021 March 13
Пятничный деплой
How to Improve Visibility in Kubernetes with Prometheus, Grafana, and NGINX

https://www.youtube.com/watch?v=hJoH7J0un5U
источник
2021 March 14
Пятничный деплой
Новая статья — новый сборник весёлых случаев от наших инженеров. В этой серии: Docker и Kafka, ZooKeeper и ClickHouse, Kubernetes и bare metal, PostgreSQL как есть. https://habr.com/ru/company/flant/blog/510486/
источник
Пятничный деплой
Performance Analysis and Troubleshooting Methodologies for Databases

https://ftp.fau.de/fosdem/2021/D.monitoring/performance_analysis_troubleshooting.webm

#fosdem #percona #mysql
источник
Пятничный деплой
4 Things you Need to Know about Writing Better Production Readiness Checklists

https://www.blameless.com/blog/4-things-you-need-to-know-about-writing-better-production-readiness-checklists
источник
Пятничный деплой
Только что опубликовал перую публичную версию провайдера для Яндекс.Облака для Pulumi 🙂

Если вы используете Pulumi с SDK для javascript/typescript, уже можно пользоваться!

https://github.com/aladmit/pulumi-yandex
источник