Банк «Санкт-Петербург» запустил новейший мониторинговый центр

В Банке «Санкт-Петербург» начал работу новейший мониторинговый центр в IT. Команда Банка поставила цель перевести мониторинг IT на новейший уровень в 2020 году. Опосля проведения аудита имеющегося процесса было принято решение найти три направления построения новейшего процесса мониторинга:

Мониторинг работоспособности приложений и клиентского опыта.
Создание и внедрение централизованной зонтичной системы.
Обеспечение оперативной реакции на действия системы мониторинга.

«По задачке внедрения мониторинга работоспособности приложений и клиентского опыта мы на данный момент находимся посреди пути и планируем окончить внедрение в 2021 году, – гласит управляющий управления мониторинга и реагирования Дирекции по информационным технологиям Банка «Санкт-Петербург» Алексей Тутуков. – Решение данной задачки дозволит нам производить мониторинг работы приложений со стороны клиента, оценивая опыт взаимодействия с нашими приложениями. Также производить мониторинг более принципиальных бизнес-процессов».

По второму пт – создание и внедрение централизованной зонтичной системы мониторинга – команда Банка в 2020 году решила ряд принципиальных задач: был внедрен функционал зонтичной системы мониторинга, разработан единый портал мониторинга и изготовлены сводные панели для определения здоровья ИТ-систем. Сейчас в «зонт» собираются метрики с разных систем мониторинга, дальше они обрабатываются, обогащаются, коррелируются и опосля выводятся на панель мониторинга и отправляются в виде предупреждений (алертов) админам. На данный момент централизованная система мониторинга состоит из одного окна контроля работоспособности ИТ-систем, централизованной рассылки предупреждений, одного хранилища метрик и аналитики метрик.

Решением третьей поставленной задачки стал пуск новейшего мониторингового центра. Был введен принцип системности: хоть какой компонент ИТ-системы ставится на мониторинг. Каждую недельку команда сверяет сбои: если система мониторинга зарегистрировала не все, добавляются агенты туда, где этот сбой произошел. Таковым образом, система повсевременно дорабатывается, возрастает ее охват.

«Наша основная цель – проактивный мониторинг, другими словами устранение препядствия еще до того, как клиент может с ней столкнуться, – отмечает Алексей Тутуков. – Для этого мы сами разработали и собрали особый портал, который собирает все предупреждения от разных систем. Действия обрабатываются системой мониторинга, происходит их корреляция. Это необходимо, чтоб созидать корневую причину сбоя и заблаговременно подавлять его.

На данный момент мы налаживаем интеграцию системы мониторинга с системой IT Service Manager, там будут автоматом фиксироваться все сбои и направляться в рабочие группы для устранения. Эти решения разрешают нам производить действенный и прозрачный контроль работоспособности всех ИТ-систем».

Для того, чтоб верно реагировать на сбои и не допускать аварий, в ИТ-блоке Банка сотворен Центр мониторинга. Группа профессионалов работает по сменам 24/7 и реагирует на алерты от системы мониторинга. Рабочее пространство группы обустроено видеостеной, на которой собраны все панели, отражающие работоспособность ИТ-систем и ИТ-инфраструктуры в Банке. Сформирован процесс сотворения run-book – аннотации, где тщательно описано, как реагировать на те либо другие ситуации. На каждое событие админ пишет специальную аннотацию для дежурных, чтоб они соображали, как им действовать: устранять сбой, собрать информацию, провести диагностику, позвонить админу и т.д. Система мониторинга будет сама давать такую аннотацию при нарушении. «Мы уже сделали огромную работу, – гласит Алексей Тутуков. – Новейший мониторинговый центр дозволяет уменьшить время реакции, а означает, время восстановления работоспособности систем. Но наша основная задачка – это уменьшить количество сбоев. В эталоне мы должны устранять хоть какой сбой еще до его возникновения. К данной нам цели мы и будем стремиться».

Источник: russia-on.ru

Бизнес портал
Добавить комментарий