ПЗ (1219668), страница 5
Текст из файла (страница 5)
if(file.open(QIODevice::ReadOnly | QIODevice::Text))//чтение
{
QTextStream in(&file);
oneString=in.readLine();//чтение одной строки
int pos=0; //позиция
while (!oneString.isNull())
{
oneString=oneString.simplified();//упрощаем
while((pos=catalogReg.indexIn(oneString,pos))!=-1) {
catalog=catalogReg.cap(0);
pos+=catalogReg.matchedLength();
catalog.replace(zamena,"/");
}
pos=0;
while((pos=allReg_domen_not.indexIn(oneString,pos))!=-1)
{
all_local=allReg_domen_not.cap(0);
pos+=allReg_domen_not.matchedLength();
}
pos=0;
while((pos=allReg.indexIn(oneString,pos))!=-1)
{
all=allReg.cap(0);
pos+=allReg.matchedLength();
}
pos=0;
int k=0;
bool b=true;
date_time.clear();
domen.clear();
name_f.clear();
type_f.clear();
size_f.clear();
if(!all.isNull())
{
for(int i=0;i<all.length();i++)
{
if(all.at(i)==' ') k++;
if(k<2) date_time.append(all.at(i));
if(k==2)domen.append(all.at(i));
if(k==3) size_f.append(all.at(i));
if(k>=4 && all.at(i)=='.') b=false;
if(k>=4 && b==true) name_f.append(all.at(i));
if(b==false) type_f.append(all.at(i));
}
if(type_f=="")
type_f="null";
name_f=name_f.simplified();
domen=domen.simplified();
dobavlenie(file_n_rabotnik,
name_f,type_f,size_f,domen,date_time,catalog);
}
if(!all_local.isNull())
{
for(int i=0;i<all_local.length();i++)
{
if(all_local.at(i)==' ') k++;
if(k<2) date_time.append(all_local.at(i));
if(k==2) size_f.append(all_local.at(i));
if(k>=3 && all_local.at(i)=='.') b=false;
if(k>=3 && b==true) name_f.append(all_local.at(i));
if(b==false) type_f.append(all_local.at(i));
}
if(type_f=="")
type_f="null";
domen="null";
name_f=name_f.simplified();
dobavlenie(file_n_rabotnik,
name_f,type_f,size_f,domen,date_time,catalog);
}
oneString.clear();
oneString = in.readLine();
}
ui->label_3->setText("<font color =green>Готово.</font color>Время записи");
ui->label_2->setNum(t.elapsed());
}
file.close();
}
Для разбора журнала процессов выполняется аналогичная операция.
После разбора журналов мониторинга, необходимо добавить данные в базу. С помощью библиотек: QSqlQuery, QSqlRecord, создаем запросы на добавление информации в БД. Ниже приведен код для добавления данных из журнала о содержимом файлов и каталогов в базу, с проверкой дублирования. Проверку дублирования проверяем запросом SELECT COUNT.
QSqlQuery query;
query.exec("SELECT COUNT(Date_create) FROM `dates_create_files` WHERE `Date_create`= '"+date_create+"'");
query.first();
if(query.value(0)=="0")
query.exec("INSERT INTO dates_create_files (Date_create) VALUE ('"+date_create+"')");
query.exec("SELECT `ID_date_create` FROM `dates_create_files` WHERE `Date_create`= '"+date_create+"'");
query.first();
date_create=query.value(0).toString();
query.exec("SELECT COUNT(Type_name) FROM `type_files` WHERE `Type_name`= '"+type_f+"'");
query.first();
if(query.value(0)=="0")
query.exec("INSERT INTO Type_files (Type_name) VALUE ('"+type_f+"')");
query.exec("SELECT `ID_file` FROM `type_files` WHERE `Type_name`= '"+type_f+"'");
query.first();
type_f=query.value(0).toString();
query.exec("SELECT COUNT(Name_user_PC) FROM `pc` WHERE `Name_user_PC`= '"+name_r+"'");
query.first();
if(query.value(0)=="0")
query.exec("INSERT INTO pc (Name_user_PC) VALUE ('"+name_r+"')");
query.exec("SELECT `ID_name_user_PC` FROM `pc` WHERE `Name_user_PC`= '"+name_r+"'");
query.first();
name_r=query.value(0).toString();
query.exec("SELECT COUNT(Domen) FROM `domen_t` WHERE `Domen`= '"+domen+"'");
query.first();
if(query.value(0)=="0")
query.exec("INSERT INTO domen_t (Domen) VALUE ('"+domen+"')");
query.exec("SELECT `ID_domen` FROM `domen_t` WHERE `Domen`= '"+domen+"'");
query.first();
domen=query.value(0).toString();
query.exec("SELECT COUNT(Catalog) FROM `catalog` WHERE `Catalog`= '"+catalog+"'");
query.first();
if(query.value(0)=="0")
query.exec("INSERT INTO catalog (Catalog) VALUE ('"+catalog+"')");
query.exec("SELECT `ID_Catalog` FROM `catalog` WHERE `Catalog`= '"+catalog+"'");
query.first();
catalog=query.value(0).toString();
Интерфейс добавления журналов в БД представлен на рисунке 10.
-
Интерфейс подключения к БД
Далее в программе реализовано отображение информации о процессах и содержимом каталогов и дисков. Для удобного поиска информации реализован поисковой фильтр по различным параметрам. Он позволяет анализировать информацию по различным категориям. Главный интерфейс программного комплекса показан на рисунке 11.
-
Главное окно программного комплекса
Данный программный комплекс нуждается в доработке и тестировании. Для полноценной реализации программного комплекса «Система контроля действия пользователя» необходимо добавить недостающие функции: мониторинг интернет активности, мониторинг USB подключений, мониторинг локальных действий и информацию о конфигурационной системе ПК.
Реализованные функции мониторинга процессов и сбора информации о хранимых файлах позволяют отслеживать и оценивать действия пользователя на предмет их соответствия корпоративным политикам. Так же комплекс служит мониторингом состояния рабочих мест, по его результатам компания может провести необходимые изменения по улучшению условий труда сотрудников.
После проведения мониторинга и занесения информации журналов логирования в базу, данных достаточно чтобы приступить к интеграции данных из MySQL в NoSQL базу данных для дальнейшего формирования базы знаний.
-
ИНТЕГРАЦИЯ ДАННЫХ ИЗ MYSQL В COUCHDB
В качестве NoSQL БД решено использовать CouchDB – это свободно распространяемая документо-ориентированная БД с открытым исходным кодом, не требующая описания схемы данных, написана на языке Erlang. В качестве формата хранения данных используется JSON. Рассмотрим подробнее эту БД.
-
Документно-ориентированная база данных CouchDB
CouchDB хранит документы в JSON-объектах, состоящие из пар ключ-значение, причем значениями могут быть данные разных типов, в том числе и другие объекты с неограниченной вложенностью. Однако произвольные запросы не поддерживаются. Основной способ поиска документов – это индексированные представления, порождаемые инкрементной процедурой MapReduce, альтернатива запросов SQL. Для реализации MapReduce-запросов используется JavaScript.
MapReduce – модель распределённых вычислений, используемая для параллельных вычислений над большими наборами данных. Работа MapReduce состоит из двух шагов: Map и Reduce. На этапе Map(отображение) происходит предварительная обработка входных данных. Отображенные документы трансформируются в map функцию и порождают emit функцию в виде ключ–значение (ключ и значения могут быть составными). На этапе Reduce происходит свёртка предварительно обработанных данных. При свертке на входе получается ключ и массив значений, порождённых для этого ключа, а на выходе получается финальный результат [22].
CouchDB обладает приятным web-интерфейсом Futon, позволяющий выполнять простые операции CRUD (create, read, update, delete). Приложения взаимодействуют с CouchDB через HTTP. Таблица аналогий операций CRUD SQL и протокола HTTP представлена в таблице 3.1.
Таблица 3.1. Аналогия операции CRUD SQL и HTTP
| Операция | Оператор в языке SQL | Операция в протоколе HTTP |
| Создание (create) | INSERT | POST |
| Чтение (read) | SELECT | GET |
| Редактирование (update) | UPDATE | PUT или PATCH |
| Удаление (delete) | DELETE | DELETE |
CouchDB можно рассматривать как сервер веб-приложений, в него встроен производительный веб-сервер, а программный код, как и данные, сохраняется в той же базе данных. Для автоматизации работы с приложениями используется утилита CouchApp. С помощью утилиты cURL можем отправлять REST запросы. Программ cURL позволяет взаимодействовать с множеством различных серверов по множеству различных протоколов с синтаксисом URL. REST (Representational State Transfer) – стиль архитектуры ПО для web-служб для взаимодействия компонентов распределённых систем в сети Интернет, при котором вызов удаленной процедуры представляет собой обычный HTTP-запрос (GET, POST).
-
Настройка подключения к web-серверу CouchDB
В качестве примера подключение будет производиться на локальном сервере. Проверить подключение можно, открыв браузер и перейдя по адресу http://localhost:5984/. По умолчанию порт выставляется 5984. При удачном подключении придет ответ от сервера в формате представленном ниже.
{"couchdb":"Welcome","uuid":"ba45799cbfee662085c7a70b7aa77335","version":"1.6.1","vendor":{"version":"1.6.1","name":"The Apache Software Foundation"}}
Если же подключение не работает, то нужно проверить конфигурационный файл local.ini, так же в нем можно настроить остальные параметры сервера.
Далее при удачном соединении мы можем перейти в web-интерфейс Futon, перейдя по адресу http://localhost:5984/_utils/.
В результате откроется удобный и эргономичный интерфейс, представленный на рисунке 12.
-
Интерфейс Futon
Futon – веб-интерфейс сервера CouchDB. Предоставляет интерфейс для большинства функций, включая возможность создавать, обновлять, удалять, просматривать документы и представления. Обеспечивает доступ к конфигурации параметров и инициации репликации. Хороший инструмент для администрирования данных.
После настройки подключения к серверу, можем перейти к программной реализации подключения и создания базы данных. Для взаимодействия с базой данных CouchDB написаны различные библиотеки, на таких языках как JavaScript, PHP, Ruby, Python и Erlang.
В качестве взаимодействия с базой данных будем использовать cURL и PHP – скриптовый язык общего назначения, интенсивно применяемый для разработки веб-приложений.
-
Взаимодействие cURL и PHP с базой данных CouchDB
Для взаимодействия с различными серверами по различным протаколам язык PHP использует библиотеку libcurl. В настоящее время libcurl поддерживает протоколы http, https, ftp, gopher, telnet, dict, file, и ldap. libcurl также умеет работать с сертификатами HTTPS, посылать запросы к HTTP серверам методами POST и PUT, закачивать файлы по протоколам HTTP и FTP, использовать прокси-серверы, cookies и аутентификацию пользователей.
Функция curl_init() создает новый сеанс CURL и возвращает дескриптор, который используется с функциями curl_setopt(), curl_exec() и curl_close(). Если передан необязательный аргумент url, опция CURLOPT_URL будет автоматически установлена в значение этого аргумента. Если этот аргумент не передан, необходимо использовать функцию curl_setopt().
Функция bool curl_setopt ( resource ch, string option, mixed value) устанавливает параметр для сеанса CURL, заданного аргументом ch. Аргумент option задает устанавливаемый параметр, а value – его значение. Параметров довольно много. Важным параметром является CURLOPT_CUSTOMREQUEST. Это специальный метод, который будет использован в HTTP запросе вместо GET или HEAD. Используется для отправки запросов DELETE . Допустимыми значениями являются GET, POST.
Пример инициализации сеанса CURL подключения к базе данных CouchDB представлен ниже:
<?php
// инициализация сеанса
$ch = curl_init();
// установка URL и других необходимых параметров















