ru

Site Reliability Engineering. Надежность и безотказность как в Google

Повідомити про появу
Щоб читати цю книжку, завантажте файл EPUB або FB2 на Букмейт. Як завантажити книжку?
  • missspraggyцитує2 роки тому
    Мы думаем, что Маргарет Гамильтон, работавшая над программой «Аполлон» во время учебы в MIT, первой продемонстрировала все основные черты SR-инженера
  • Timofey Buninцитує3 роки тому
    Надеяться — это плохая стратегия.
  • Timofey Buninцитує3 роки тому
    Реализация эфемерна, а задокументированное обоснование бесценно.
  • Dmitry Rybalkaцитує5 років тому
    Что может пойти не так?», «Какие действия мы можем предпринять для того, чтобы справиться с проблемами до того, как они приведут к сбою или потере данных?».
  • Dmitry Rybalkaцитує5 років тому
    Но при этом у менеджера есть две особые обязанности, которых нет у TL: управление производительностью и выполнение всей той работы, которой не занимается кто-то другой.
  • Dmitry Rybalkaцитує5 років тому
    Например, сервису по мере его роста нужен способ увеличить количество сконфигурированных виртуальных машин (virtual machines, VM). Команда, выполняющая операционную работу, отвечает увеличением количества администраторов, управляющих этими VM. SR-инженеры вместо этого концентрируются на написании ПО или избавлении от проблем с масштабируемостью, чтобы количество людей, необходимое для работы сервиса, не увеличивалось согласно функции увеличения нагрузки на сервис.
  • Dmitry Rybalkaцитує5 років тому
    Операционная работа против нелинейного масштабирования
    Термин «операционная работа» характеризует определенный метод поддержания сервиса в рабочем состоянии.
  • Dmitry Rybalkaцитує5 років тому
    вводить новых людей только в том случае, если усложняется сервис. Вместо этого попробуйте обратить внимание на то, как полезные новые навыки снижают время, за которое выполняются тикеты.
  • Dmitry Rybalkaцитує5 років тому
    Имейте в виду: чтобы быть экспертом, мало знать, как работает система. Настоящие знания приходят с изучением причин, почему система не работает.
  • Dmitry Rybalkaцитує5 років тому
    Нам пришлось заменить sshd аутентифицируемым, управляемым ACL (Access Control List — список управления доступом), основанным на RPC-демоне Local Admin Daemon, также известном как Admin Server.
fb2epub
Перетягніть файли сюди, не більш ніж 5 за один раз