Предлагается подход к расчету характеристик надежности кластерной вычислительной системы из двух взаимозаменяемых серверов. Цель статьи заключается в повышении точности расчета характеристик надежности кластерной системы, достигаемом путем введения предпосылок о не экспоненциальном распределении длительности безотказной работы и восстановления серверов.
Описана полумарковская модель такой системы в виде двух условно независимых случайных процессов восстановления. Для учета не экспоненциального закона распределений длительности безотказной работы и восстановления серверов кластера рассмотрен двумерный процесс до момента двойного отказа. При любом начальном состоянии, когда один сервер работает, а другой – нет, момент двойного отказа наступает, когда оба сервера находятся в состоянии ремонта. В качестве показателя надежности вычислительного кластера используется среднее время безотказной работы кластера, определяемое через вероятность застать кластерную систему в рабочем состоянии в произвольный момент времени. Обосновано использование аналитических выражений для расчета среднего времени безотказной работы вычислительного кластера из двух серверов, один из которых находится в горячем резерве. При этом важной отличительной особенностью рассмотренной полумарковской модели надежности вычислительного кластера является то, что длительности восстановления отказавшего сервера могут иметь произвольный закон распределения. Для уточнения характеристик надежности кластерной вычислительной системы обсуждается возможность использования инструментальных средств мониторинга. Приводятся результаты численных расчетов характеристик надежности кластерной вычислительной системы. Основной результат – аналитическая оценка влияния коэффициента вариации не экспоненциального распределения длительности восстановления сервера в используемой модели надежности на значение среднего времени безотказной работы кластера, показывающая насколько повышается точность расчета этого показателя надежности кластерной вычислительной системы из двух взаимозаменяемых серверов. Обоснована целесообразность уточнения характеристик надежности кластерной вычислительной системы с помощью инструментальных средств мониторинга.