В Банке «Санкт-Петербург» начал работу новейший мониторинговый центр в IT. Команда Банка поставила цель перевести мониторинг IT на новейший уровень в 2020 году. Опосля проведения аудита имеющегося процесса было принято решение найти три направления построения новейшего процесса мониторинга:
Мониторинг работоспособности приложений и клиентского опыта.
Создание и внедрение централизованной зонтичной системы.
Обеспечение оперативной реакции на действия системы мониторинга.
«По задачке внедрения мониторинга работоспособности приложений и клиентского опыта мы на данный момент находимся посреди пути и планируем окончить внедрение в 2021 году, – гласит управляющий управления мониторинга и реагирования Дирекции по информационным технологиям Банка «Санкт-Петербург» Алексей Тутуков. – Решение данной задачки дозволит нам производить мониторинг работы приложений со стороны клиента, оценивая опыт взаимодействия с нашими приложениями. Также производить мониторинг более принципиальных бизнес-процессов».
По второму пт – создание и внедрение централизованной зонтичной системы мониторинга – команда Банка в 2020 году решила ряд принципиальных задач: был внедрен функционал зонтичной системы мониторинга, разработан единый портал мониторинга и изготовлены сводные панели для определения здоровья ИТ-систем. Сейчас в «зонт» собираются метрики с разных систем мониторинга, дальше они обрабатываются, обогащаются, коррелируются и опосля выводятся на панель мониторинга и отправляются в виде предупреждений (алертов) админам. На данный момент централизованная система мониторинга состоит из одного окна контроля работоспособности ИТ-систем, централизованной рассылки предупреждений, одного хранилища метрик и аналитики метрик.
Решением третьей поставленной задачки стал пуск новейшего мониторингового центра. Был введен принцип системности: хоть какой компонент ИТ-системы ставится на мониторинг. Каждую недельку команда сверяет сбои: если система мониторинга зарегистрировала не все, добавляются агенты туда, где этот сбой произошел. Таковым образом, система повсевременно дорабатывается, возрастает ее охват.
«Наша основная цель – проактивный мониторинг, другими словами устранение препядствия еще до того, как клиент может с ней столкнуться, – отмечает Алексей Тутуков. – Для этого мы сами разработали и собрали особый портал, который собирает все предупреждения от разных систем. Действия обрабатываются системой мониторинга, происходит их корреляция. Это необходимо, чтоб созидать корневую причину сбоя и заблаговременно подавлять его.
На данный момент мы налаживаем интеграцию системы мониторинга с системой IT Service Manager, там будут автоматом фиксироваться все сбои и направляться в рабочие группы для устранения. Эти решения разрешают нам производить действенный и прозрачный контроль работоспособности всех ИТ-систем».
Для того, чтоб верно реагировать на сбои и не допускать аварий, в ИТ-блоке Банка сотворен Центр мониторинга. Группа профессионалов работает по сменам 24/7 и реагирует на алерты от системы мониторинга. Рабочее пространство группы обустроено видеостеной, на которой собраны все панели, отражающие работоспособность ИТ-систем и ИТ-инфраструктуры в Банке. Сформирован процесс сотворения run-book – аннотации, где тщательно описано, как реагировать на те либо другие ситуации. На каждое событие админ пишет специальную аннотацию для дежурных, чтоб они соображали, как им действовать: устранять сбой, собрать информацию, провести диагностику, позвонить админу и т.д. Система мониторинга будет сама давать такую аннотацию при нарушении. «Мы уже сделали огромную работу, – гласит Алексей Тутуков. – Новейший мониторинговый центр дозволяет уменьшить время реакции, а означает, время восстановления работоспособности систем. Но наша основная задачка – это уменьшить количество сбоев. В эталоне мы должны устранять хоть какой сбой еще до его возникновения. К данной нам цели мы и будем стремиться».
Источник: