Rambler's Top100
Статьи ИКС № 05 2014
Олег САУШКИН  06 мая 2014

Отказоустойчивость в SIP и доступность контакт-центров

В конкурентной бизнес-среде доступность услуг контакт-центра становится стратегической необходимостью для предприятий и поставщиков услуг, поскольку это ключевой фактор удержания клиентов.

Олег САУШКИН, глава представительства Genesys в России и СНГОчевидно, что перерывы в обслуживании обходятся компаниям дорого: они приводят к неудовлетворенности клиентов, потерям выручки и информации (при блокировке доступа к информации – даже к потере данных), падению производительности. Поэтому необходимо искать решения, которые позволяют избежать остановки работы и быстро устранить возникший сбой. Таким требованиям отвечают SIP-системы (Session Initiation Protocol – протокол установления сеанса), которые обеспечивают не только качественный сервис, но и окупаемость инвестиций.

Что приводит к перерывам в обслуживании?

Перерывы в работе систем контакт-центра, которые создают препятствия работе с клиентами, можно разделить на две основные категории: запланированные и непрогнозируемые. Последствия вторых для компании более негативны.

Причины запланированных простоев:

  • обслуживание систем;
  • обновление программного и аппаратного обеспечения;
  • резервное копирование данных.

Причины непрогнозируемых  простоев:

  • отказ аппаратного обеспечения или отключение электропитания;
  • отказ программного обеспечения – операционной системы, межплатформенного ПО или приложения;
  • внешние условия: скачки температуры и природные катаклизмы;
  • человеческий фактор: ошибки или неверные действия пользователей.

Измерение доступности

Доступность – это зависимость между средним временем, в течение которого система работает без ремонта (СВБР), и средним временем до восстановления ее работоспособности (СВВ); обычно выражается в процентах, обозначая долю часов в год, когда система обеспечивает приемлемый уровень работы.



В таблице указаны параметры для системы 24 Ч 7 Ч 365. Доступность контакт-центра означает безотказную работу системы в течение времени, когда с ее помощью можно обработать запрос клиента на надлежащем уровне.

Доступность сервиса благодаря SIP-решениям

Современные ИТ-решения обеспечивают доступность выше 99,999% с незапланированным временем простоя менее пяти минут в год. Основой для оценки доступности является метод пространства состояний по Маркову, применимый как к аппаратным, так и к программным решениям.

Опираясь на показатели лучших практик, модели Маркова используются для расчета вероятной доступности SIP-решений. Измерения доступности SIP-решений проводятся по следующим направлениям:

  • проверка устойчивости;
  • предупреждение интенсивности отказов;
  • анализ доступности платформы.

Международно признанной моделью качества работы программного обеспечения является CMMI (Capability Maturity Model Integration), предложенная Институтом по разработке программного обеспечения (SEI) Университета Карнеги-Меллона (США).

Современные программные решения позволяют повысить доступность, внедрив особый учет потенциальных перебоев в работе. В частности, для контакт-центров разработаны современные ИТ-продукты, поддерживающие общие свойства системы или параметров и либо предотвращающие события, способные повлиять на доступность, либо минимизирующие их пагубное влияние. Возможность вовремя обеспечивать необходимые свойства системы представляет собой страховку от угроз, наиболее частых при незапланированных перебоях в работе. Разумеется, здесь не учитываются нарушения, вызванные работой программных продуктов из других подразделений.

Благодаря высокой доступности в случаях отказа оборудования и критических программных сбоев (которые требуют перезагрузки поврежденного модуля) гарантируется непрерывность обслуживания за счет резервного аппаратного и программного обеспечения и программных механизмов, которые совместно определяют и изолируют проблему и автоматически восстанавливают работу в случае сбоя.

 
 
Работа с двумя приложениями

Большинство современных решений основаны на модели первичной и резервной высокой доступности, когда основной узел отслеживается соответствующим уровнем управления. Если он дает сбой, резервному узлу поступает команда принять на себя роль основного и продолжать обработку.

Существуют два вида приложений – для «горячего» и «теплого» резервов. С помощью первого обеспечивается высокая доступность для приложений, определяющих обработку вызовов: таких, как SIP-сервер и общий маршрутизатор (Universal Routing Server).

Приложения горячего резерва обеспечивают синхронизацию основных данных в первичных и резервных узлах, позволяя последним в случае необходимости продолжать работу с небольшой потерей вызовов (или без потерь). Кроме того, клиенты приложений горячего резерва устанавливают соединения с первичными и вторичными узлами, обеспечивая бесшовную отказоустойчивость.

Приложения теплого резерва не синхронизируют данных в первичных и резервных узлах, и клиенты не устанавливают параллельных соединений. Во время восстановления работы приложения теплого резерва контакт с клиентом может ненадолго прерваться, но это не приведет к потере вызовов.

Высокая отказоустойчивость с балансировкой нагрузки

Система высокой отказоустойчивости с балансировкой нагрузки состоит из двух компонентов: сервера, который обеспечивает соответствующий вид обслуживания, и диспетчера, который распределяет входящую рабочую нагрузку между несколькими серверами – обычно поровну по круговой системе. В некоторых случаях диспетчер нагрузки должен поддерживать сохранение сессии, чтобы обеспечить пересылку последующих запросов тому же серверу, которому адресовался первый запрос.

Отказоустойчивость параллельного режима

Система с отказоустойчивостью параллельного режима состоит из нескольких компонентов, выполняющих идентичную обработку данных. В отличие от системы с балансировкой нагрузки здесь работа скорее дублируется, нежели распределяется.

Отказоустойчивая инфраструктура

В дополнение к отказоустойчивости на компонентах различного уровня, она внедрена в инфраструктуру управления.

На рисунке 3 показана гипотетическая настройка системы с указанием некоторых ключевых аспектов управления отказоустойчивостью в современных ИТ-системах для контакт-центра. С такой инфраструктурой, сервер управления решениями (SCS) руководит работой всех компонентов системы. Сюда входят пуск и остановка их работы, а также управление отказоустойчивостью основных и резервных узлов. SCS работает в связке с несколькими копиями локального агента управления (LCA) – копия устанавливается на каждый физический хост и обеспечивает интерфейс между SCS и отдельным компонентами, установленными на хосте.

Управление решениями

Приложения управления (администрирования) тоже могут содействовать улучшению работы системы, обеспечивая централизованное и удаленное управление, а также своевременное устранение неисправностей и других проблем. Такие приложения в современных ИТ-системах для контакт-центров обеспечивают ряд преимуществ:

  • централизованное управление решениями и мониторинг их состояния в реальном времени, а также активацию и отмену решений или приложений;
  • централизованную фиксацию событий технического обслуживания с внесением записей любым приложением в единый журнал, что обеспечивает легкий доступ и устранение проблем;
  • гибкую аварийную сигнализацию в каждом случае технического обслуживания, записанном любым приложением; также возможно автоматическое перенаправление предупреждающего сообщения системному администратору;
  • функции устранения сбоев, включающие в себя определение, изолирование и коррекцию сбоев приложений.

  

Таким образом, именно решения с характеристиками высокой отказоустойчивости позволяют компаниям и поставщикам услуг устранить перерывы в обслуживании потребителей и быстро восстановить сервисную систему после сбоев. За счет использования SIP-систем бизнес может решить эту проблему и обеспечить бесперебойную работу своего контакт-центра, предоставляя стабильный клиентский сервис и снижая отток клиентов.
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!
Поделиться: