Фильтрация нежелательных приложений интернет-ресурсов в целях информационной безопасности

Шелухин О.И., Смычек М.А., Симонян А.Г.

Рассмотрена актуальная задача контроля доступа к Интернет-ресурсам имеющая важное прикладное значение: блокирование доступа к нелегальной, экстремистской, антисоциальной информации, предотвращение утечки конфиденциальной информации через Интернет и др.

Для решения подобных задач широкое распространение используются методы машинного обучения. Традиционные методы классификации сетевого трафика, основанные как на номерах портов, так и на информационной нагрузке, полагаются на прямое изучение сетевых пакетов. При наличии полного и помеченного тренировочного набора данных, целесообразно строить классификатор, используя технологии машинного обучения (Machine Learning) и интеллектуального анализа данных (Data Mining), оказавшиеся наиболее эффективными. Создание «идеального» классификатора невозможно пока не будут решены проблемы, присущие данной области. Прежде всего это отсутствие общего, репрезентативного набора исходных данных, который мог бы стать стандартным для исследований в данной области. Большинство известных работ посвященных проблеме классификации трафика опускают фундаментальное требование определения неизвестного типа трафика.

Целью работы является исследование эффективности алгоритмов классификации приложений сетевого трафика в условиях наличия фонового трафика.

Новизной представленного решения является анализ следующих групп приложений: Web –протоколы просмотра web-сайтов – http, https; ftp –протокол для передачи файлов ftp; mail –протоколы для передачи электронной почты – SMTP, POP3, IMAP; p2p –протоколы приложений, использующие пиринговые сети для передачи файлов путем использования алгоритмов машинного обучения: С4.5; Random Forests; Support Vector Machine; Bagging и Adaptive Boost в условиях наличия неклассифицируемогоо (фонового) трафика. Показано, что качество классификации в условиях наличия фонового трафика снижается для всех рассматриваемых алгоритмах классификации. Однако поскольку алгоритмы C4.5, Random Forests, Bagging и AdaBoost построены на использовании деревьев принятия решений – одного в случае (С4.5) или множества, их характеристики остаются достаточно высокими и отличаются незначительно.

Выставки | Конференции

Тематика публикуемых статей по рубрикатору ГРНТИ

28.00.00	Кибернетика
49.00.00	Связь
49.03.05	Теория обработки сигналов в системах связи
49.27.00	Система передачи
49.31.00	Многоканальная связь
49.39.00	Телефонная связь и аппаратура
49.43.00	Радиосвязь и радиовещание
49.33.35	Надежность сетей связи и защита информации
50.00.00	Автоматика. Вычислительная техника
50.37.23	Защита от несанкционированного доступа. Физическая защита информации.
50.41.27	Компьютерные вирусы. Антивирусные программы.
81.93.29	Информационная безопасность. Защита информации.
89.00.00	Космические исследования

Тематика публикуемых статей по номенклатуре специальностей

2.2.15 Системы, сети и устройства телекоммуникаций (технические науки)

2.3.1 Системный анализ, управление и обработка информации (технические науки)

2.3.5 Математическое и программное обеспечение вычислительных систем, комплексов и компьютерных сетей (технические науки)

2.3.6 Методы и системы защиты информации, информационная безопасность (технические науки)

2.5.13 Проектирование, конструкция и производство летательных аппаратов (технические науки)

2.5.16 Динамика, баллистика, управление движением летательных аппаратов (технические науки)

Редакционная коллегия

Бобровский В.И.
(д.т.н., доцент, начальник отдела ОАО "ИНТЕЛТЕХ")

Борисов В.В.
(д.т.н., профессор, Действительный член Академии военных наук РФ, профессор кафедры вычислительной техники МЭИ)

Будко П.А.
(д.т.н., профессор, профессор кафедры технического
обеспечения связи и автоматизации ВАС)

Будников С.А.
(д.т.н., доцент, действительный член Академии информатизации
образования, начальник кафедры автоматизированных
систем управления ВУНЦ ВВС "ВВА")

Верхова Г.В.
(д.т.н., профессор, заведующая кафедрой автоматизации
предприятий связи СПб ГУТ им. профессора М.А.Бонч-Бруевича)

Гончаревский В.С.
(д.т.н., профессор, заслуженный деятель науки и техники
РФ, профессор кафедры технологий и средств технического
обеспечения и эксплуатации автоматизированных систем
управления ВКА имени А.Ф.Можайского)

Комашинский В.И.
(д.т.н., профессор, профессор кафедры обработки и передачи
дискретных сообщений СПб ГУТ им. профессора
М.А.Бонч-Бруевича)

Кирпанев А.В.
(д.т.н., доцент, начальник отдела ОАО «НПП «РАДАР ММС»)

Курносов В.И.
(д.т.н., профессор, академик Арктической академии наук,
академик Международной академии информатизации,
академик Международной академии обороны, безопасности
и правопорядка, член-корреспондент РАЕН, главный научный
сотрудник ОАО "НИИ "Рубин")

Мануйлов Ю.С.
(д.т.н., профессор, профессор кафедры автоматизированных
систем управления космических комплексов ВКА имени
А.Ф.Можайского)

Морозов А.В.
(д.т.н., профессор, действительный член Академии военных наук РФ, начальник кафедры автоматизированных систем боевого управления ВА ВПВО ВС РФ)

Мошак Н.Н.
(д.т.н., доцент, начальник отдела ОАО "ИНТЕЛТЕХ")

Пророк В.Я.
(д.т.н., профессор, профессор кафедры автоматизированных
систем управления ВКА имени А.Ф.Можайского)

Семенов С.С.
(д.т.н., доцент, профессор кафедры технического
обеспечения связи и автоматизации ВАС)

Синицын Е.А.
(д.т.н., профессор, начальник НИО ОАО "ВНИИРА")

Шатраков Ю.Г.
(д.т.н., профессор, заслуженный деятель науки РФ, ученый
секретарь ОАО "ВНИИРА")

НАУКОЕМКИЕ ТЕХНОЛОГИИ
В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ