авторефераты диссертаций www.x-pdf.ru
БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
 

3

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Современному этапу развития информационно-

телекоммуникационных

систем

(ИТКС)

характерны

массовое

использование локальных, корпоративных, глобальных вычислительных

сетей и применение новых технологий.

Это, в свою очередь,

обуславливает

необходимость

контроля

субъектов

информационных

процессов для идентификации возможных направлений информационного

воздействия на пользователей сети Интернет. В связи с тем, что порядка 80%

информации в сети Интернет представлено в текстовом виде, возникает

необходимость в разработке средств идентификации пользователей на основе

методов математической лингвистики, предназначенных для обеспечения

информационной

безопасности

объектов

политической,

социально-

экономической, оборонной, культурной и других сфер деятельности от

внешних и внутренних угроз хищения, разрушения и/или модификации

информации. В рамках этой задачи крайне важна идентификация субъектов

информационных

процессов,

имеющих

возможность

легально

распространять “недобросовестные” текстовые сообщения. Это может быть

связано с различными способами “серой” накрутки рейтингов ссылок на

сообщения, подмены авторства текстов, внедрения “дополнительных”

пользователей порталов для ведения и поддержки узко направленной

дискуссии.

Весомый вклад в обеспечение информационной безопасности в рамках

данного вопроса внесли такие известные ученые как: Н.Н. Безруков, П.Д.

Зегжда, Дж. М. Кэррол, А.М. Ивашко, Р. Сандху, А.И. Костогрызов, В.И.

Курбатов, К. Лендвер, А.А. Молдовян, Н.А. Молдовян, А.А.Малюк,

Е.А.Дербин, развивая теорию методов информационного воздействия и

обосновывая

значимость

различных

средств

информационного

противоборства в современных реалиях методов ведения бизнеса.

Большое количество интернет ресурсов и сервисов, таких как форумы,

порталы, интернет-магазины, сталкиваются с различными проявлениями

проблемы манипуляции и искусственного формирования общественного

мнения путем «организации» целенаправленных тематических диалогов, в

которых ряд пользователей имеют несколько учетных записей. Возможность

использования порталов и сайтов для распространения информации и

недостаточная

функциональность

механизмов

идентификации

и

аутентификации пользователей, оставляющих сообщения, определяет ряд

направлений совершенствования систем

информационной безопасности ИТКС.

защиты и систем мониторинга

В

связи

с

этим возникает

задача

повышения

вероятностных

показателей качества методов идентификации пользователей различных

порталов сети Интернет.

4

Целью работы является повышение вероятности идентификации

субъектов информационных процессов открытых ресурсов сети Интернет на

основе методов математической лингвистики.

Для достижения указанной цели в диссертации решаются следующие

основные научные и технические задачи:

1. Анализ и выявление достоинств и недостатков методов идентификации

пользователей

порталов

сети

Интернет,

применяемых

для

противодействия

угрозам

нарушения

ИБ

(информационной

безопасности) в открытых информационных системах.

2. Исследование свойств и особенностей текстов коротких сообщений

различных Интернет ресурсов для реализации моделей, методов и

методик идентификации пользователей.

3. Обоснование использования моделей идентификации пользователей

открытых ресурсов для обработки системами мониторинга ИБ коротких

сообщений различных порталов сети Интернет.

4. Совершенствование методов и средств идентификации субъектов

информационных

процессов

с

целью

информационного

противодействия угрозам ИБ.

5. Выявление ограничений использования моделей, методов и алгоритмов

идентификации пользователей порталов сети Интернет.

В соответствии с заявленными целями и задачами работы объектом

исследования

являются

системы

идентификации

субъектов

информационных процессов

порталов

сети

Интернет,

а

предметом

исследования – методы и средства идентификации пользователей на основе

лингвистических характеристик текстовой информации.

На защиту выносятся следующие основные результаты:

1. Модель идентификатора пользователя портала сети Интернет на основе

кортежа лингвистических признаков короткого сообщения.

2. Метод создания компонентного профиля пользователя портала сети

Интернет, базирующегося на модели идентификатора, содержащего

кортеж лингвистических признаков.

3. Методика идентификации пользователя портала сети Интернет на

основе компонентного профиля.

Научную новизну диссертационной работы составляют:

1. Модель идентификатора пользователя портала сети Интернет на

основе кортежа лингвистических признаков короткого сообщения,

отличается от известных использованием признакового пространства,

содержащего синтаксические паттерны и нераспознанные “шумовые”

словоформы, что позволяет увеличить количество информативных

характеристик, используемых в процессе идентификации.

2. Метод создания компонентного профиля пользователя портала сети

Интернет, отличается от известных использованием характеристик

лингвистических

конструкций,

полученных

после

преобразований;

использованием

-

-

-

-

-

методик и математического аппарата теории

вероятности, теории БД (баз данных), проверенных экспериментами;

системным анализом описания объекта исследования, учетом

сложившихся практик и опыта в ИБ;

проведением сравнительного анализа предложенного метода с

существующими решениями и результатами экспериментов;

непротиворечивостью

полученных

результатов

известным

решениям;

апробацией и одобрением на научно-технических

практической

конференциях.

5

морфосинтаксической обработки, что позволяет увеличить сложность

подмены идентификатора.

3. Методика идентификации пользователя портала сети Интернет на

основе компонентного профиля отличается от известного применения

к ней лингвистического признакового пространства, характерного

для коротких сообщений порталов сети Интернет, что позволяет

увеличить показатели качества (вероятность идентификации) для

систем мониторинга состояния ИБ и СЗИ ресурсов.

Достоверность результатов работы подтверждается:

- научной обоснованностью приводимых выкладок и математических

Практическую значимость результатов диссертационной работы

составляют предложенные модели, методы и алгоритмы для средств

идентификации пользователей портала сети Интернет, которые позволяют

повысить вероятность обнаружения подмены авторства информации в

системах мониторинга ИБ ИТКС.

Реализация результатов. Полученные модели и методы реализованы

в рамках научно-исследовательских работ и опытно-конструкторских работ,

выполняемых в НИУ ИТМО.

Апробация работы.

Основные

результаты

работы

представлялись

на

следующих

конференциях:

- 22-я научно-техническая конференция “Методы и технические

средства обеспечения безопасности информации”, СПбГПУ, г.

Санкт-Петербург, 2013;

- Конгресс молодых ученых (КМУ 2013), НИУ ИТМО, г. Санкт-

Петербург, 2013;

- Всероссийская научная конференция по проблемам информатики

СПИСОК-2013, СПбГУ, г. Санкт-Петербург, 2013;

- Advances in Methods of Information and Communication Technology

(AMICT'2013), ПетрГУ, г. Петрозаводск, 2013;

- Application of Information and Communication Technologies

(AICT 2014), Nazarbayev University, Astana, 2014;

6

- 23-я научно-техническая конференция “Методы и технические

средства обеспечения безопасности информации”, СПбГПУ, г.

Санкт-Петербург, 2014;

- Конгресс молодых ученых (КМУ 2014), Университет ИТМО, г.

Санкт-Петербург, 2014;

- 24-я научно-техническая конференция “Методы и технические

средства обеспечения безопасности информации”, СПбПУ, г. Санкт-

Петербург, 2015.

Публикации.

По

результатам

диссертационного

исследования

опубликовано 9 работ, из них статей в изданиях, рекомендованных ВАК РФ –

4 (1 статья, индексируется в международной цитатно-аналитической базе

данных (SCOPUS)).

Структура и объем работы. Диссертационная работа содержит

общую характеристику работы, 3 раздела, заключение, список литературы.

Объем работы составляет 108 страниц. Работа содержит 38 рисунков, 8

таблиц.

СОДЕРЖАНИЕ

В

общей

характеристике

работы

приводятся

сведения

о

диссертационном исследовании с указанием актуальности, новизны, научной

и практической значимости, количестве и степени публикаций и внедрения

результатов

исследования,

раскрывается

структурное

построение

диссертации.

В

первой

главе

описывается

современный

этап

развития

информационных технологий, и обосновывается необходимость в контроле и

мониторинге пользователей и субъектов информационных процессов в

глобальной сети Интернет. Строится модель угроз информационной

безопасности.

Анализируется применимость моделей текстовой информации для

технологий

идентификации

пользователей

порталов

сети

Интернет,

описываются

отличительные

особенности

текстов

комментариев,

позволяющие сформировать кортеж лингвистических признаков короткого

сообщения. Приводятся данные статистических исследований, которые

демонстрируют основные особенности коротких текстовых сообщений

Интернет-пользователей:

- умышленное искажение словоформ русского языка, затрудняющее

автоматическую обработку сообщений;

- грамматически неправильно построенные фразы;

- использование

специфической

лексики,

аббревиатур

и

конструкций, характерных для целевой аудитории ресурса ИТКС;

небольшое количество слов в сообщениях;

-

-

пунктуационной,

повсеместное

отсутствие

орфографической,

грамматической и стилистической коррекции.

7

Производится описание существующих методов идентификации

автора текстовой информации. Делается вывод, что в соответствии с

перечисленными отличительными особенностями текстов комментариев в

сети Интернет, существует возможность совершенствования средств и

методов

идентификации

пользователей

порталов

для

повышения

вероятностных

показателей

обнаружения

использования

нескольких

учетных записей.

Во второй главе в целях повышения вероятности правильной

идентификации рассматривается модель идентификатора пользователя

портала сети Интернет на основе кортежа лингвистических признаков

короткого сообщения:

(1)

M = L, SLP, SS, SP, SE, H,

где:

- L – признаки лексического уровня. Рассматриваются слова,

употребляемые комментатором портала, и частоты их применения.

На этом уровне осуществляется анализ текстовых сообщений

пользователя и выделение лексических конструкций на основе слов

и словоформ русского языка.

- SLP – признаки лексикографического уровня. Идентифицируются

шаблоны

буквенных

сокращений

и

символьно-буквенных

сочетаний. На этом уровне происходит лексикографический анализ

сообщения и выделение конструкций в соответствии с описанными

шаблонами.

- SS – признаки графематического уровня обработки текстовых

сообщений. В рамках данного признака анализируется и собирается

статистика об использовании знаков препинания и специальных

символов.

- SP – признаки синтаксического уровня обработки текстовой

информации,

включающие

информацию

о

шаблонах

(синтаксических

паттернах).

На

данном

этапе

сообщение

разбирается по частям речи с последующим применением шаблонов

(синтаксических

паттернов)

для

выделения

наиболее

распространенных конструкций.

- SE

признаки

лексического

уровня

обработки

текстовой

информации, направленные на анализ и выявление тематических

специальных слов и выражений, характерных для аудитории

конкретного форума.

- H – шум или нераспознанные лексические и синтаксические

конструкции.

С

целью

оптимального

использования

характеристик

модели

идентификатора пользователя портала сети Интернет возникает вопрос

определения наиболее информативных признаков. Оценка информативности

производится с помощью подхода на основе энтропии Шеннона, где в

- G – количество градаций признака;

- K – количество классов;

- Pi – вероятность i-той градации признака;

- I(xi) – информативность xi синтаксической структуры.

Таблица 1. Оценка информативности синтаксических признаков

идентификатора пользователя портала сети Интернет

Обозначение, xi

Описание

I(xi)

I’(xi)

0,67

0,6

0,58

0,52

0,5

0,46

0,4

0,36

0,42

0,41

0,4

0,38

0,45

0,4

0,46

0,43

0,41

0,39

0,45

0,42

0,48

0,41

0,34

0,3

0,52

0,46

0,43

0,39

0,56

0,51

0,57

0,52

0,31

0,27

0,34

0,3

S + Pril

S + G

S + S

Ch + S

Nar + S

Nar + Pril

G + Nar

G + S

Mest+Pril

Mest+S

G + Predl + S

Predl + S + S

S + Predl + S

S + G + Nar

S + S + SS

G + S + SS

S + Predl + Pril

S + Nar + Pril

Существительное + прилагательное

Существительное + глагол

Существительное + существительное

Числительное + существительное

Наречие + существительное

Наречие + прилагательное

Глагол + Наречие

Глагол + существительное

Местоимение + прилагательное

Местоимение + существительное

Глагол + предлог + существительное

Предлог

+

существительное

существительное

Существительное

+

предлог

существительное

8

качестве признаков используются синтаксические структуры, основные из

которых представлены в таблице 1.

Оценка информативности лингвистических признаков идентификатора

производится с учетом (I’(xi)) и без учета (I(xi)) нераспознанных

морфологическим анализатором синтаксических конструкций (H). В качестве

аргументов рассматриваются наиболее часто используемые пользователями

портала сети Интернет синтаксические паттерны.

+

+

Существительное + глагол + наречие

Существительное + существительное +

специальный символ

Глагол

+

существительное

+

специальный символ

Существительное

прилагательное

Существительное

прилагательное

+

предлог

+

+

наречие

+

I(xi)  1 

,

(2)

G

K

PP

logK Pi,k

i

i,k

i1

k1

где:

9

На основании проведенной выборки были получены результаты,

представленные на рисунке 1.

I(x )

Рисунок 1. Информативность синтаксических структур идентификатора

пользователя портала сети Интернет

Таким образом, представлена модель идентификатора пользователя

портала сети Интернет на основе кортежа лингвистических признаков

короткого

сообщения,

отличающаяся

от

известных

использованием

признакового пространства, содержащего синтаксические паттерны и

нераспознанные

“шумовые”

словоформы

и

позволяющая

увеличить

количество информативных характеристик, используемых в процессе

идентификации, что является первым результатом, выносимым на защиту.

Результаты анализа каждого элемента выражения (1) используются для

создания компонентного профиля пользователя портала сети Интернет,

базирующегося

на

модели

идентификатора,

содержащего

кортеж

лингвистических признаков. Формирование пространства лингвистических

признаков для коротких сообщений осуществляется с учетом особенностей

написания, принятых в сети Интернет.

Модель идентификатора пользователя

применяется для создания

лингвистического профиля для каждого участника портала сети Интернет,

оставляющего текстовые сообщения.

На основе модели предлагается метод создания компонентного

профиля пользователя портала сети Интернет, направленный на повышение

вероятности правильной идентификации при оставлении сообщений с одного

компьютера или одной локальной вычислительной сети, когда с помощью

стандартных признаков (например, Coocie, IP-адреса и т.д.) невозможно

однозначно идентифицировать субъект.

На рисунке 2 изображен процесс создания компонентного профиля

пользователя портала сети Интернет.

i

Получение

выборки

пользовательских

сообщений в рамках Интернет портала

Разбор

сообщений

по

частям

речи

с

последующим

применением

шаблонов

(синтаксических паттернов) для выделения

наиболее распространенных конструкций

Выделение шумовых конструкций (H)

Символьный анализ

Лексикографический анализ сообщения и

выделение конструкций в соответствии с

описанными шаблонами и сбор статистики об

использовании

знаков

препинания

и

специальных символов

Определение графематическиих

признаков (SS)

Определение

лексикографических признаков

(SLP)

Выделение шумовых конструкций (H)

Лексический анализ

Выделение

лексических

конструкций

на

основе слов и словоформ русского языка, а

также выявление тематических специальных

Лексический уровень (L)

Лексикографический уровень

специальных выражений (SE)

10

Обработка пользовательских

сообщений

Вычисление синтаксических

признаков (SP)

для

Выделение шумовых конструкций (H)

Рисунок 2. Последовательность шагов метода создания компонентного

профиля пользователя портала сети Интернет

Для

построения профиля пользователя

(UPi) проводится

сбор

информации

по

текстовым

сообщениям

обучающей

выборки.

Рассматривается

Интернет:

компонентный

профиль

пользователя

портала

сети

UPi = f (M)

(3)

профиль пользователя – это функции результата обработки частот

данных различных уровней идентификатора пользователя. То есть:

UPi = f(l, slp, ss, sp, se, h)

,

(4)

- l – частоты лексического уровня, включающие слова и словоформы;

- slp – частоты лексикографического уровня, включающие обработку

текста согласно символьно-буквенным шаблонам;

где:

слов

и

выражений,

характерных

аудитории конкретного форума.

11

- ss

частоты

графематического

уровня,

включающие

сбор

статистики об использовании комбинаций знаков препинания и

специальных символов;

- sp – частоты синтаксического уровня, включающие разбор

сообщений по частям речи с последующим применением шаблонов

(синтаксических паттернов);

- se – частоты лексического уровня, включающие разбор специальных

слов и выражений, характерных для аудитории конкретного форума;

- h – частоты уровня шума, включающие анализ нераспознанных

лексических, синтаксических и графематических конструкций;

- UPi – профиль i-го пользователя.

На рисунке 3 представлены статистические данные профиля для трех

случайных

пользователей.

Приводится

процентное

использование

синтаксических, лексических, графематических и шумовых конструкций от

общего числа классифицированных данных.

Рисунок 3. Компонентные профили пользователя портала сети Интернет

При построении компонентного профиля пользователя возникает

необходимость расчета сложности подмены идентификатора пользователя.

Для оценки был использован семантико-синтаксический анализатор на

основе словаря В.А. Тузова. Особенностью данного анализатора является

необходимость текста высокого качества для обработки. Анализатор

показывает высокие показатели на грамматически и пунктуационно

грамотно

написанных

текстах

и

имеет

большую

вычислительную

сложность. В рамках Интернет общения грамматически грамотных

конструкций крайне мало, в связи с чем столь высокая сложность

обработки

данных

не

имеет

смысла

в

силу

несовершенства

обрабатываемого текста. Предлагаемый алгоритм ориентируется на

образование связи между двумя ближайшими словоформами, описанными

в виде семантико-синтаксических предикатов. Из этого следует, что

необходимо

производить

анализ

их

возможного

соединения

с

предыдущими словами. В этом случае, для предикатных моделей

вычислительные затраты на анализ возможностей образования связей

будут составлять:

(4)

p

C n ,

где:

- p – среднее количество связей предиката в БД;

12

- n – количество лингвистических конструкций сообщений.

Учитывая, что среднее количество аргументов предикатов около 3,

то при таком подходе будет характерна кубическая зависимость. Таким

образом, вычислительная сложность подмены данных злоумышленником

имеет кубичный рост в зависимости от обрабатываемой информации –

увеличение обучающей выборки вдвое увеличивает необходимое для

подмены время в восемь раз. На рисунке 4 представлен график

зависимости количества операций по образованию связей C от количества

лингвистических конструкций для предлагаемой модели.

С

n

Рисунок 4. График зависимости количества операций от количества

лингвистических конструкций сообщения

Таким образом, разработан метод создания компонентного профиля

пользователя портала сети Интернет, который отличается от известных

использованием характеристик лингвистических конструкций, полученных

после морфосинтаксической обработки, что является вторым результатом,

выносимым на защиту.

В третьей главе приводится методика идентификации пользователя

портала

сети

Интернет

на

основе

компонентного

профиля,

последовательность действий которой представлена на рисунке 5.

На первом этапе методики происходит обработка пользовательских

сообщений. Из каждого сообщения выделяется только значимая для

получения лингвистических признаков текстовая часть.

На втором этапе полученная обучающая выборка обрабатывается с

целью получения кортежа (1). В каждом сообщении пользователя

вычисляются статистические характеристики лингвистических признаков,

которые

заносятся

в

базу

идентификаторов пользователя.

данных

в

соответствии

с

записями

Обработка пользовательских

сообщений

Создание идентификатора

пользователя на основе

кортежа лингвистических

признаков

Построение компонентного

профиля пользователя

портала сети Интернет

Оценка качества

характеристик

идентификатора

пользователя

Получение

выборки

пользовательских

сообщений в рамках Интернет-портала

Разбор

пользовательских

сообщений

в

соответствии с признаковым пространством

Построение

компонентного

профиля

происходит на основе собранной информации

по

текстовым

сообщениям

обучающей

выборки

Оценка качества выбираемых

характеристик на основе вероятностного

подхода

13

На третьем этапе методики происходит построение компонентного

профиля на основе полученных после обработки текстовых сообщений

данных.

На

четвертом

этапе

осуществляется

оценка

качественных

характеристик идентификатора пользователя.

Рисунок 5. Методика идентификации пользователя портала сети

Интернет

Для

оценки

был

применен

подход

на

основе

байесовского

классификатора:

(5)

- P(c|d) — вероятность того, что лингвистическая последовательность

d принадлежит пользователю c;

- P(d|c)

вероятность

встретить

лингвистическую

последовательность d среди всех документов пользователя c;

- P(c)

безусловная

вероятность

встретить

лингвистическую

последовательность пользователя c в корпусе сообщений портала;

- P(d)

безусловная

вероятность

лингвистической

последовательности d в

последовательностей портала.

корпусе

лингвистических

P(d | c)P(c)

P(d)

P(c | d) 

где:

,

(6)

- Dc -

количество

последовательностей

в

обучающей

выборке

принадлежащих пользователю c;

- D - общее количество последовательностей в обучающей выборке;

- |V| - количество уникальных слов во всех последовательностях

обучающей выборки;

- Lc -

суммарное

количество

лингвистических

структур

в

последовательностях пользователя c в обучающей выборке;

- Wic

количество i-ых

лингвистических

структур

в

последовательностях пользователя c в обучающей выборке;

- Q -

множество

лингвистических

структур

классифицируемой

последовательности (включая повторы).

Исходя из выражения (6) выбирается пользователь с максимальным

значением.

Для анализа полученных в исследовании результатов были проведены

эксперименты по сравнению приводимых решений с решениями других

исследователей на основе алгоритмов N-грамм уровня символов, анализа

частотных

словарей,

метода

опорных

векторов,

классического

многослойного перцептрона и сети каскадных корреляций.

В результате применения метода для (1) получены результаты,

приведенные на рисунках 6-13. Представлены графики зависимости

вероятности идентификации от размера обучающей выборки для каждого из

признаков.

��(��│��)

Размер обучающей выборки

L

SLP

SS

SP

SE

H

Рисунок 6. График зависимости вероятности идентификации автора от

количества обработанных на этапе обучающей выборки сообщений

14

На этапе оценки качества характеристик идентификатора для каждого

пользователя рассчитывается значение выражения:

n

log

iQ

Dc

D

P(с | d)  log

где:

Wic 1

V Lc,

SE

H

SLP

��(��│��)

L

15

Размер обучающей выборки

SP

Рисунок 7. График зависимости вероятности идентификации автора от

количества обработанных на этапе обучающей выборки сообщений

Рисунок 8. График вероятности идентификации пользователя при помощи

признака L в режиме 1 из 250 и 1 из 350 пользователей.

Рисунок 9. График вероятности идентификации пользователя при помощи

признака SLP в режиме 1 из 250 и 1 из 350 пользователей.

SS

16

Рисунок 10. График вероятности идентификации пользователя при помощи

признака SS в режиме 1 из 250 и 1 из 350 пользователей.

Рисунок 11. График вероятности идентификации пользователя при помощи

признака SP в режиме 1 из 250 и 1 из 350 пользователей.

Рисунок 12. График вероятности идентификации пользователя при помощи

признака SE в режиме 1 из 250 и 1 из 350 пользователей.

Рисунок 13. График вероятности идентификации пользователя при помощи

признака H в режиме 1 из 250 и 1 из 350 пользователей.

17

Кортеж признаков модели идентификатора пользователя L, SLP, SP,

SE, H показали стабильно высокие результаты идентификации пользователей

порталов сети Интернет, в то время как признак SS показал неоднозначные

результаты при увеличении количества анализируемых пользователей.

Применение методики позволяет на основании обучающей выборки

сообщений пользователя портала сети Интернет определить: принадлежит ли

ему произвольно взятое сообщение.

Таким образом, приведена методика идентификация пользователей

порталов сети Интернет на основе методов математической лингвистики, что

является третьим результатом, выносимым на защиту.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

В

процессе

диссертационного

исследования

были

получены

следующие результаты:

1.

Предложен

кортеж

лингвистических

признаков

короткого

сообщения. Оценка информативности на основе энтропии Шеннона показала

возможность

применения

для

решения

задачи

идентификации

синтаксических и лексикографических характеристик, включающих в себя

синтаксические паттерны и символьно-буквенные сочетания.

2.Разработана модель идентификатора пользователя портала сети

Интернет на основе кортежа лингвистических признаков короткого

сообщения,

основанная

на

признаковом

пространстве,

содержащем

лингвистические паттерны и нераспознанные “шумовые” словоформы, что

позволяет

увеличить

количество

характеристик

для

идентификации

авторства.

3. Предложен метод создания компонентного профиля пользователя

портала сети Интернет, базирующегося на модели идентификатора,

содержащего кортеж признаков на основе характеристик лингвистических

конструкций, полученных после морфосинтаксической обработки, что

позволяет

производить

количественную

оценку

с

использованием

идентификационных признаков для идентификации пользователей порталов

сети Интернет. Произведен анализ сложности вычислительных процессов

подмены идентификаторов, использующих лингвистические характеристики.

4. Предложенный метод идентификации пользователя портала сети

Интернет, позволяет достичь 67%-ю вероятность для систем мониторинга

состояния ИБ и СЗИ ресурсов.

5. Применение приведенных моделей и методов, использующих

лингвистическое признаковое пространство, позволяет повысить на 23%

вероятность идентификации пользователей порталов сети Интернет по

сравнению со стандартными статическими признаками (cookie, IP-адреса и

т.д.),

что

дает

возможность

применить

результаты

для

выявления

потенциального нарушителя ИБ в сети Интернет.

18

СПИСОК ЛИТЕРАТУРЫ

Статьи, изданные в научных журналах рекомендованный ВАК:

1.

Сухопаров М.Е., Лебедев И.С., Комаров И.И., Соловьев И.Н. Методика

анализа архитектуры систем защиты информации на основе типовых

элементов // Научно-технический вестник информационных технологий,

механики и оптики. – 2013. – №3(85). – С. 151 – 154. – 0,19 п.л.

2.

Сухопаров М.Е., Лебедев И.С. Методика идентификации авторства

текстов коротких сообщений пользователей порталов сети Интернет на

основе методов математической лингвистики // В мире научных открытий. –

2014. – №6.1(54). – С. 599 – 622. – 1,44 п.л.

3.

Сухопаров М.Е. Методика установления авторства текстов коротких

сообщений пользователей порталов сети Интернет при помощи методов

математической лингвистики // Проблемы информационной безопасности.

Компьютерные системы. – 2014. – №2. С. 85 – 93. – 0,5 п.л.

Статьи, индексируемые в международных цитатно-аналитических базах

данных (SCOPUS):

4.

Sukhoparov M., Lebedev I. Methodologies of Internet portals users' short

messages texts authorship identification based on the methods of mathematical

linguistics // Application of Information and Communication technologies (AICT

2014). – 2014. – C. 231 – 239. – 0,5 п.л.

Статьи, изданные в других научных журналах и изданиях:

5.

Сухопаров М.Е. Установление авторства коротких сообщений порталов

сети Интернет с использованием методов математической лингвистики //

Материалы 22-й научно-технической конференции “Методы и технические

средства обеспечения безопасности информации”. – СПб: СПбГПУ, 2013. –

С. 125 – 126.

6.

Сухопаров М.Е. Определение авторства текстов коротких сообщений

различных порталов сети Интернет при помощи методов математической

лингвистики // Сборник тезисов докладов конгресса молодых ученых. – СПб:

СПбНИУ ИТМО, 2013. – С. 140 – 141.

7.

Сухопаров М.Е. Идентификация авторов коротких сообщений порталов

сети Интернет с использованием методов математической лингвистики //

Материалы

всероссийской

научной

конференции

по

проблемам

информатики СПИСОК-2013. – СПБ: СПбНИУ ИТМО, 2013. – С. 686 – 688.

8.

Сухопаров М.Е. Методика определения авторства текстов коротких

сообщений пользователей порталов сети Интернет на основе наивного

байесовского классификатора // Материалы 23-й научно-технической

конференции “Методы и технические средства обеспечения безопасности

информации”. – СПб: СПбГПУ, 2014. – С. 55 – 57.

9. Сухопаров М.Е. Информативность признаков лингвистического профиля

пользователя // Материалы 24-й научно-технической конференции “Методы

и технические средства обеспечения безопасности информации”. – СПб:

СПбПУ, 2015. – С. 62 – 67.



Похожие работы:

«Енютина Екатерина Дмитриевна ОСОБЕННОСТИ ХУДОЖЕСТВЕННОГО ПОДХОДА К ФОРМИРОВАНИЮ СОВРЕМЕННОЙ ГОРОДСКОЙ СРЕДЫ 05.23.20 – Теория и история архитектуры, реставрация и реконструкция историко-архитектурного наследия АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата архитектуры Нижний Новгород – 2015 РАБОТА ВЫПОЛНЕНА В ФГБОУ ВПО САМАРСКИЙ ГОСУДАРСТВЕННЫЙ АРХИТЕКТУРНО-СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ Научный руководитель Лекарева Нина Афанасьевна кандидат архитектуры, профессор...»

«КОЛОДИН ПАВЕЛ СЕРГЕЕВИЧ ЭКСПЕРИМЕНТАЛЬНО КОРРЕКТИРУЕМЫЕ КОМПЬЮТЕРНЫЕ МОДЕЛИ ГЕКСАФЕРРИТОВЫХ ГИРОМАГНИТНЫХ РЕЗОНАТОРОВ Специальность 05.12.04 Радиотехника, в том числе системы и устройства телевидения АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Москва, 2015 Работа выполнена на кафедре основ радиотехники ФГБОУ ВО НИУ МЭИ Научный руководитель: Поллак Борис Павлович, кандидат технических наук, доцент, доцент кафедры основ радиотехники ФГБОУ ВО...»

«ВАХРОМОВ РОМАН ОЛЕГОВИЧ ИЗМЕНЕНИЯ СТРУКТУРЫ, СВОЙСТВ И УРОВНЯ ОСТАТОЧНЫХ НАПРЯЖЕНИЙ В КОВАНЫХ ПОЛУФАБРИКАТАХ ИЗ АЛЮМИНИЕВОГО СПЛАВА 1933 В ЗАВИСИМОСТИ ОТ ХИМИЧЕСКОГО СОСТАВА И РЕЖИМОВ ТЕРМИЧЕСКОЙ ОБРАБОТКИ Специальность: 05.16.01 Металловедение и термическая обработка металлов и сплавов АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Москва – 2015 государственный Н.Э. Баумана кандидат технических наук, начальник Научно-исследовательского ФГУП...»





 
© 2015 www.x-pdf.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.