Rambler's Top100
Статьи
25 мая 2019

Как предотвратить простой системы ДБО

Финансовая сфера крайне динамична, поэтому в случае простоя бизнес-приложений банк каждую минуту теряет клиентов. Как справиться с этой проблемой, рассказывает Алексей Складчиков, старший руководитель группы систем управления ИТ-инфраструктурой компании ICL Services.

Конкуренцию в банковском секторе способны выдержать лишь те компании, сервисы которых работают бесперебойно, как часы. Чтобы пользователю не приходилось подолгу ждать отклика программ, необходимо еще до возникновения инцидента понять его возможные причины и способы их устранения. А также иметь инструменты и гибкие решения, которые могут в этом помочь.

– Алексей, расскажите о возможностях работы предиктивного мониторинга в банковской сфере.

– Предиктивный мониторинг – это неотъемлемая часть современной и развивающейся финансовой компании. Сегодня интернет-банки – одни из наиболее динамичных систем электронной коммерции, поэтому все больше людей пользуются системами дистанционного банковского обслуживания (ДБО), и здесь очень важно обеспечить такой уровень сервиса, чтобы клиент не ушел к конкуренту. Говоря другими словами, чем раньше мы найдем неисправность в каком-либо узле системы ДБО, тем быстрее мы ее устраним. Тогда пользователь системы не заметит неполадки и продолжит пользоваться продуктами банка. Таким образом мы увеличиваем долю бизнеса данного банка и привлекаем новых клиентов. Ведь если банк стабильный и сервисы у него функционируют 24/7 без сбоев, то это говорит о том, что банку можно доверять.


– Какие существуют риски при отсутствии мониторинга?

– Я отвечу очень просто: инфраструктура в любой момент может дать сбой, и приложение или сервис, с которыми работает пользователь, станут недоступны. В результате клиент может уйти к другому банку, провайдеру или в другой интернет-магазин. Он не будет ждать.

Думаю, каждый из нас сталкивался с такой ситуацией, что мы заходим в интернет-банк, а приложение говорит: извините, зайдите позже. В этот момент, по всей вероятности, ведутся пусконаладочные работы, поэтому пользователю сервис недоступен. Чтобы этого избежать, необходимо иметь зарезервированную (задублированную) инфраструктуру, но, к сожалению, требуемые для этого средства могут позволить себе только компании-гиганты.

Мониторинг приложений (Application Performance Monitoring) – это система, например, на базе Dynatrace, которая позволяет не только соотносить между собой тысячи событий, порождаемых функционированием инфраструктуры, но и анализировать действия пользователей конкретного приложения. То есть ряд проблем мы можем выявить заранее, предиктивно, до того, как с ними столкнется пользователь. Система Dynatrace – лидер в данном сегменте программного обеспечения, это мощный инструмент для анализа производительности и доступности систем ДБО, порталов и интернет-магазинов.

– В банки часто поступают жалобы пользователей на недоступность сервиса ДБО (с мобильных устройств, с десктопов). Можно ли обеспечить комфортное время отклика (уровень производительности) системы ДБО для клиентов?

– К сожалению, мы живем в реальном мире и понимание комфортного для пользователей времени отклика различных систем у всех разное: кому-то удобно говорить, что система не работает и он не сделал то или иное дело потому, что система «зависла» и он ждал 20 минут пока она «отвиснет». Если о таком инциденте сообщат команде поддержки серверов, они начнут искать, что же произошло, потратят массу времени, а на самом деле система работала прекрасно. И получается, что время инженеров и администраторов было потрачено впустую, а истинная причина заключалась в другом. Но может быть и так – система в определенных ситуациях работает медленно, что неприемлемо с точки зрения выполнения бизнес-задач персонала, или у клиента долго подгружается страница, хотя он пользуется LTE.

Комплекс гибких решений Dynatrace – это инструмент, который позволяет строить определенные системы отклика приложений для пользователей и при возникновении какой-либо проблемы оперировать историческими данными. Что это значит? Система в течение недели обучается на посещениях пользователями приложения или сервиса и на основе событий инфраструктуры определяет «уровень нормальности», который показывает, что приложение работает правильно. И когда происходят какие-либо аномальные события, система сигнализирует об этом заранее, поскольку анализирует миллионы зависимостей. Она сообщает о сбоях, потому что подмечает все детали, например, что страница для оплаты товаров в интернет-магазине загружается не 2 секунды, а 20.

Поэтому обеспечить комфортный уровень производительности системы ДБО для клиентов можно, но это не значит, что система сама будет что-то исправлять. Она может только заранее сигнализировать о проблемах, которые могут возникнуть, для того чтобы оперативно их устранить. Мне кажется, это очень важно – предупредить пользователя о возможных неполадках сервиса, извиниться и попросить его выполнить операцию через некоторое время. Тем самым мы покажем ему, что знаем о неполадке, что уже работаем над этой проблемой и ждем его обратно в свой магазин через 5 минут.


– Что делать, если инвестирование в развитие инфраструктуры или ПО не приносит ожидаемых результатов: сервис лучше не становится, не снижается количество жалоб пользователей, не растет количество пользователей сервиса?

– Представим себе ситуацию: основным каналом продаж компании является интернет-магазин. У компании, конечно же, есть ИТ-инфраструктура – серверы и базы данных, ПО, которое и есть, по сути, интернет-магазин. Но новая версия ПО, которое для компании пишет сторонняя организация, стала требовать больше вычислительных ресурсов. Отказаться от новой версии невозможно: добавились новые «фишки» для пользователей, и, как показала фокус-группа, они привлекают клиентов. Однако работать все стало намного медленнее, поэтому разработчики говорят о том, что необходимо больше «железа». Компания покупает новое «железо», но обнаруживает, что производительность приложения увеличивается не на 50%, а всего лишь на 10%, и понимает, что инвестициями в «железо» проблему не решить. При этом системные администраторы не могут указать, где именно софт не оптимизирован. И что делать в такой ситуации? Продолжать докупать «железо» или переписывать ПО и терять клиентов, которым нравятся новые «фишки»? Система Dynatrace, основываясь на анализе взаимодействия пользователей с данным приложением, как раз может показать влияние софта на производительность «железа» и наоборот.

– Расскажите более подробно о том, что получает заказчик в результате.

– Заказчик получает отчеты об инфраструктурной части: список всех неисправностей, которые были выявлены за выбранный период, их причины, отчеты о качестве предоставляемого сервиса, о доступности работы приложения, информацию о географии пользователей при работе с приложением. Он может увидеть детализированные запросы и сервисы, которые при данных запросах были нагружены больше, чем остальные. Также доступны топ-5 инфраструктурных проблем, пиковые периоды, когда инфраструктура и приложения были наиболее нагружены. Это поможет планировать изменения в дальнейшем.

– Приведите, пожалуйста, примеры реальных кейсов.

– Расскажу о наиболее интересных: для банковского сектора и ритейла.

Первый кейс – это банк. У крупного банка были проблемы с системой ДБО, а именно ее хаотичные отказы. К тому же из-за того, что отсутствовало целостное понимание работы системы ДБО, для решения проблем требовалось много времени. После внедрения системы предиктивного мониторинга удалось увидеть все взаимосвязи компонентов, время на поиск неисправностей сократилось на 80%, а лояльность клиентов повысилась на 70%, поскольку все неисправности начали устраняться быстро и пользователи очень редко сталкивались с «зависанием» системы.

Второй кейс – это магазин премиум-сегмента. Здесь проблема заключалась в том, что приложение, которое помогало продавцам через планшеты контролировать наличие остатков товара на других складах или в точках продажи, временами отрабатывало очень долго и клиенты уставали ждать и уходили. Тем не менее приложение было необходимо постоянно. После внедрения системы мониторинга мы эмулировали действия продавца с этим приложением через статические транзакции, и теперь система сигнализирует о проблемах с этой программой заранее. Тем самым продавцы уже управляют ожиданиями клиентов, что позволяет повысить лояльность, а средний чек увеличить. В итоге: стабильная работа приложения, посетители не ждут и тратят деньги.


– Каковы плюсы предиктивного мониторинга ДБО для бизнеса?

– Во-первых, это получение реальных данных о текущей работе сервисов ДБО. Во-вторых, возможность отслеживания критичных KPI и SLA. Кроме того, заказчику обеспечивается детальная информация о функционировании системы с точки зрения пользователей, а также быстрая локализация источников проблем.

– С чего начать внедрение? Какой первый шаг, что делать?

– Если вы понимаете, что вам необходима квалифицированная помощь, то лучше обратиться к аутсорсеру. Так, мы сможем совместно провести пилотный проект, на котором выберем одно приложение или сервис. При этом сразу же будет подготовлена необходимая документация, будут проведены обследование и подготовка. После заказа лицензии и настройки системы в течение двух недель пройдет тестовая эксплуатация. И последний этап – отчетная реализация и определение дальнейших шагов.
Поделиться:
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!