НАУКОЕМКИЕ ТЕХНОЛОГИИ
В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ

Бинарная классификация многоатрибутных размеченных аномальных событий компьютерных систем с помощью алгоритма SVDD

Шелухин О.И., Раковский Д.И.

Введение: в настоящее время объем системных журналов компьютерных систем, объединенных в распределенную сетевую инфраструктуру, делает невозможным их ручную проверку в режиме реального времени. Как правило, структура каждой записи журнала содержит численное значение наблюдаемого атрибута и соответствующую пометку (маркер), помечающее запись как нормальное или аномальное.

Алгоритм описания данных опорными векторами демонстрирует высокую точность классификации уже при малых объемах обучающей выборки. Особенностью алгоритма является работа с многоатрибутным набором данных, где каждое наблюдение содержит общую классифицирующую маркировку. Следовательно, возникает задача о сведении маркировок атрибутов исходных данных к единой маркировке всего наблюдения. Цель исследования: исследование точности бинарной классификации экспериментальных данных алгоритмом описания данных опорными векторами при малом объеме обучающей выборки для случая поатрибутно маркированных экспериментальных данных. Методы исследования: предложен метод для решения задачи о сведении маркировок атрибутов исходных данных к единой маркировке посредством подходов «полностью нормальное наблюдение» и голосования по мажоритарному принципу. Рассмотрены два вида данных: упорядоченные во времени и равномерно перемешанные. Точность классификации оценена при помощи вычисления площади под ROC‑кривыми с проведением кросс-­валидации при разном количестве атрибутов. Результаты: сравнительный анализ способов маркировки наблюдений показал преимущество подхода «полностью нормальное наблюдение» перед подходом «мажоритарное голосование» без «взвешивания». Показано, что точность классификации на перемешанных данных выше на 7% по сравнению с вариантом упорядочивания данных во времени. Исследована точность алгоритма при различном количестве атрибутов с использованием подхода «полностью нормальное наблюдение». Максимально достигнутая точность классификации составила порядка 96% при работе с 6 атрибутами, при равномерном перемешивании входного набора данных. Дальнейшее увеличение количества атрибутов приводит к снижению средней точности классификации по причине роста доли аномальных наблюдений. Показано, что при использовании равномерного перемешивания входных данных выигрыш по точности может быть увеличен на 15–20%. Практическая значимость: алгоритм демонстрирует экспоненциальный рост потребления вычислительных ресурсов при увеличении объема входных данных. Обсуждение: для достижения максимальной точности классификации при приемлемом потреблении ресурсов необходимо сформировать компактный набор входных данных, наиболее полно отражающий функционирование компьютерной системы в нормальном режиме.

Тематика публикуемых статей по номенклатуре специальностей

2.2.15  Системы, сети и устройства телекоммуникаций (технические науки)

2.3.1  Системный анализ, управление и обработка информации (технические науки)

2.3.5 Математическое и программное обеспечение вычислительных систем, комплексов и компьютерных сетей (технические науки)

2.3.6 Методы и системы защиты информации, информационная безопасность (технические науки)

2.5.13 Проектирование, конструкция и производство летательных аппаратов (технические науки)

2.5.16 Динамика, баллистика, управление движением летательных аппаратов (технические науки)

Редакционная коллегия

Бобровский В.И.
(д.т.н., доцент, начальник отдела ОАО "ИНТЕЛТЕХ")

Борисов В.В.
(д.т.н., профессор, Действительный член Академии военных наук РФ, профессор кафедры вычислительной техники МЭИ)

Будко П.А.
(д.т.н., профессор, профессор кафедры технического
обеспечения связи и автоматизации ВАС)

Будников С.А.
(д.т.н., доцент, действительный член Академии информатизации
образования, начальник кафедры автоматизированных
систем управления ВУНЦ ВВС "ВВА")

Верхова Г.В.
(д.т.н., профессор, заведующая кафедрой автоматизации
предприятий связи СПб ГУТ им. профессора М.А.Бонч-Бруевича)

Гончаревский В.С.
(д.т.н., профессор, заслуженный деятель науки и техники
РФ, профессор кафедры технологий и средств технического
обеспечения и эксплуатации автоматизированных систем
управления ВКА имени А.Ф.Можайского)

Комашинский В.И.
(д.т.н., профессор, профессор кафедры обработки и передачи
дискретных сообщений СПб ГУТ им. профессора
М.А.Бонч-Бруевича)

Кирпанев А.В.
(д.т.н., доцент, начальник отдела ОАО «НПП «РАДАР ММС»)

Курносов В.И.
(д.т.н., профессор, академик Арктической академии наук,
академик Международной академии информатизации,
академик Международной академии обороны, безопасности
и правопорядка, член-корреспондент РАЕН, главный научный
сотрудник ОАО "НИИ "Рубин")

Мануйлов Ю.С.
(д.т.н., профессор, профессор кафедры автоматизированных
систем управления космических комплексов ВКА имени
А.Ф.Можайского)

Морозов А.В.
(д.т.н., профессор, действительный член Академии военных наук РФ, начальник кафедры автоматизированных систем боевого управления ВА ВПВО ВС РФ)

Мошак Н.Н.
(д.т.н., доцент, начальник отдела ОАО "ИНТЕЛТЕХ")

Пророк В.Я.
(д.т.н., профессор, профессор кафедры автоматизированных
систем управления ВКА имени А.Ф.Можайского)

Семенов С.С.
(д.т.н., доцент, профессор кафедры технического
обеспечения связи и автоматизации ВАС)

Синицын Е.А.
(д.т.н., профессор, начальник НИО ОАО "ВНИИРА")

Шатраков Ю.Г.
(д.т.н., профессор, заслуженный деятель науки РФ, ученый
секретарь ОАО "ВНИИРА")