Рубрики
Без рубрики

Как и почему я построил пользовательские рамки проверки здоровья для работы в k8s Pods

Пользовательские системы проверки здоровья для остановленных / неудачных рабочих мест, работающих в C8S PODS.

Автор оригинала: himanshu gautam.

Обо мне

Опытный программный инженер с превосходными навыками решения проблем и способность работать под давлением и привести команду.

Проблема, которую я хотел решить

Реализуйте структуру проверки здоровья для клиента, который будет контролировать работу в контейнерах K8S, и приносит пользовательские правила на журналы, чтобы убить застольные задания.

Какая таможенная структура проверки здоровья для работы в C8S PODS?

Мой клиент хотел решить проблему с их нынешней архитектурой. У них была работа обработки данных, которые они работают в контейнере Docker, используя K8S в качестве оркестратора. Поскольку их работа не изыскана и имеет ошибку, их контейнер иногда застрял в заселенном состоянии. Они хотели контролировать же и перезапустить контейнер или соответственно убить работу. Со всеми этими они хотели, чтобы динамические правила отображаются и механизм регистрации, поэтому разработчик может изучать журналы позже. Даже если контейнер был выселен.

Tech Stack.

После исследования текущего технологического стека, который решает часть проблемы, я придумал следующую.

  • Графана для приборной панели и мониторинга
  • Локи собирает журналы контейнеров
  • Пользовательская служба принять меры на стручках K8S.
  • Я решаю пойти на весеннюю загрузку Java Service, так как я знаком с этим Tech и работал над этим.

Процесс построения пользовательских медицинских структур проверки здоровья для работы в C8S PODS

Я сломал заявление о проблеме в небольших и управляемых кусках:

  • Сначала установили Loki и Grafana на тестовой установке в качестве услуги. (Использование HELM Charts)
  • Затем я делаю приборную панель. Также реализованы некоторые правила для фильтрации журналов.
  • Затем я предложил разработку с результатами POC, что я сделал на пример данных.
  • После этого я выполнил следующие задачи для полной реализации:
    • Подготовлена приборная панель с оповещениями и настроенными веб-кавками.
    • Сделайте оператор-сервис, который слушает звонки WebHook для выполнения некоторых действий с использованием API K8S
    • Служба оператора требует некоторых привилегий для вызова API K8S, так что эти проблемы делали
    • Затем, наконец, упаковывало все это в качестве кода для переноса (с кондиционированием для автоматической установки с использованием HELM-диаграммы и Anisible)
    • Представлено на рассмотрение
    • Наконец-то документы API и вся документация завершена.
    • Отправленный проект.

Проблемы я столкнулся

  • Это был мой первый раз, когда играл с Локи и Графаной. Мне было трудно в начале, но со временем стало легче.
  • Придумываясь с краями, при подготовке дизайна и POC было сложно, как и ожидалось.

Назначение ключей

  • Я узнал много навыков общения при обсуждении решения с заинтересованными сторонами
  • Это было связано с тщательным исследованием, который придумал дизайн. Я понял, что его важность

Советы и советы

  • Не рекомендуется заново изобретать колесо. Вы должны использовать решения, доступные и придумали быстрое и эффектное решение

Окончательные мысли и следующие шаги

  • Ни одна система не является идеальной, я буду работать в будущем, чтобы улучшить решение, которое я предоставляю этому клиенту.
  • Общелом был отличный проект как в терминах для изучения новых технологий, а также сложный дизайн. Общий сложный проект