Диссертация (1091077), страница 17
Текст из файла (страница 17)
Оценка эффективности метода распределенной обработкиданных и прикладных процессов в вычислительномкомплексе информационных сервисов электронногообученияВ этом пункте оценивается эффективность предложенного в диссертацииметода распределенной обработки данных и прикладных процессов в ВКИСЭО, воснове которого разработанные в данной главе ДМРД и ДМПП для ВКИСЭО.Хотя метод “Широковещательный опрос” не совсем пригоден дляВКИСЭО, но он в большей степени соответствует его требованиям, чем другиепроанализированные в п. 2.2 существующие методы распределенной обработкиданных [54].
Поэтому оценка эффективности делается относительно этого метода[54]. Для краткости дальнейшего изложения вычислительный комплекс на основеэтого метода обозначим следующим образом: ВКШО [54].Допустим, что в каждом ОЦ ВКИСЭО/ВКШО присутствуют только такиезаписи, к каждой из которой имеет отношение хотя бы одно другое ОЦ.Рассматриваются только учащиеся, поскольку именно эти пользователи создаютпреобладающее количество обращений и записей в БД. По существу, обычныезаписи в ВКШО – это тоже самое, что первичные записи в ВКИСЭО. В расчетахучитываются только такие факторы, которые существенно влияют на результат.Оценка эффективности поиска распределенных данныхИспользуются следующие обозначения:• R – количество ОЦ;k• U – количество учащихся в k-м ОЦ;k• n ij – количество обычных/первичных записей, которые были созданы вj-м ОЦ i-м пользователем из k-го ОЦ;k• h ij – это количество вторичных записей в k-м ОЦ, первичные записикоторых были созданы в j-м ОЦ i-м пользователем из k-го ОЦ.Предположим, что в ВКИСЭО/ВКШО отсутствуют индексы к таблицам,108тогда оценим объем записей, который нужно просмотреть, чтобы найти искомуюзапись в ВКИСЭО/ВКШО.КоличествоUk∑ni =1kikR −1 U jзаписейвk-гоОЦвВКИСЭОравно:R −1 U k+ ∑∑ n + ∑∑ h ixkjikj=1 i =1БД( R −1x =1 i =1–этоозначает,чтоисключенизрассмотрения k-й ОЦ, т.е.
j ≠ k и x ≠ k), включающее следующие записи:Uk•∑ni=1kik– записи, сгенерированные учащимися k-го ОЦ;R −1 U j•∑∑ nj=1 i =1R −1 U k•∑∑ hx =1 i =1jik– записи, сгенерированные учащимися из других ОЦ (т.е. j ≠ k);kix– вторичные записи, первичные записи которых сгенерированыобучаемыми из k-го ОЦ в других ОЦ.Количество записей БД k-го ОЦ в ВКШО состоит из того же количествазаписей,Uk∑ni =1kikкаквВКИСЭО,исключаяколичествовторичныхзаписей:R −1 U j+ ∑∑ n ikjj=1 i =1Таким образом, чтобы получить необходимую запись в ВКИСЭО, сделавзапрос из k-го ОЦ, то необходимо прочитать только записи k-го ОЦ, а в ВКШО –необходимо прочитать записи во всех ОЦ:Uk• в ВКИСЭО:• в ВКШО:∑ni =1RUkk =1i =1kik∑ (∑ nR −1 U jR −1 U k+ ∑∑ n + ∑∑ h ixk ;j=1 i =1kikjikx =1 i =1R −1 U j+ ∑∑ n ikj ) .j=1 i =1Допустим экстремальную ситуацию для ВКИСЭО и ВКШО:• учащиеся создают одновременно одинаковое количество записей ( N ) вовсех ОЦ ( R );• каждое ОЦ содержит одинаковое количество учащихся ( U ).109Тогда весь расчет можно свести к следующему:• в ВКШО:RUkk =1i =1∑ (∑ NkikR −1 U j+ ∑∑ N ikj ) = R × ( U × N + (R − 1) × U × N) ⇒j=1 i =1(4.1)⇒ R2 × U × N• в ВКИСЭО:Uk∑Ni =1kikR −1 U jR −1 U k+ ∑∑ N + ∑∑ H ixk =j=1 i =1jikx =1 i =1= U × N + (R − 1) × U × N + (R − 1) × U × N ⇒(4.2)⇒ (2R − 1) × U × NТеперь предположим, что при поиске по любой таблице в ВКИСЭО/ВКШОбудет использоваться индекс, который будет ускорять поиск в D раз, тогданужно в каждой таблице просмотреть не U записей, а U / D записей, тогдавыражения 4.1 и 4.2, соответственно, будут иметь следующий вид:2• в ВКШО: R × U/D × N(4.3)• в ВКИСЭО: (2R − 1) × U/D × N.(4.4)Из выражений 4.1-4.4 следует, что, в общем случае, ВКИСЭО превосходит2ВКШО в R /(2R - 1) раз.
Кроме того, это не зависит от количества пользователейи создаваемых записей, поэтому ими можно пренебречь при сравнении ВКИСЭОи ВКШО.Таким образом, в обобщенном виде, при увеличении количества ОЦсложность поиска данных в ВКИСЭО возрастает линейно: (2R - 1) , а в ВКШО –2квадратично: R . Это продемонстрировано в таблице 3.2 и на рисунке 3.22.ВКТаблица 3.2 – Зависимость сложности поиска данных от количества ОЦ [54]RR=10 R=20 R=30 R=40 R=50 R=60 R=70 R=80 R=90 R=100ВКШО – R 2ВКИСЭО – (2R - 1)Показатель эффективностиR 2 /(2R - 1)1001940039900 1600 2500 3600 4900 6400 8100 10000597999 119 139 159 1791995.26 10.26 15.25 20.25 25.25 30.25 35.25 40.25 45.2550.25110ВКШОВКИСЭОсложность поиска данных120001000080006000ВКШО40002000ВКИСЭО010 20 30 40 50 60 70 80 90 100количество образовательных центровРисунок 3.22 – Зависимость сложности поиска данных от количества ОЦ [54]При этом в ВКИСЭО основная часть обращений в другие ОЦ может бытьисключена, поскольку особенности ДМРД позволяют фильтровать записи иполучать некоторые данные, используя вторичные записи, без обращения вдругие ОЦ, а в ВКШО обращение во все ОЦ является обязательным.Оценкаэффективностиизменения,созданияиудаленияраспределенных данныхКак правило, в любой первичной записи, могут быть ссылки на записитолько из одного другого ОЦВК.
Это объясняется тем, что из другого ОЦВКбудет либо лектор, либо учащийся. Получается, что при внесении изменений впервичные записи будут максимум задействованы только два ОЦВК: в одномОЦВК изменяется первичная запись, а в другом – изменяется соответствующаявторичная запись. Обозначим количество задействованных других ОЦВК впервичной записи через “h” (т.е. в ВКИСЭО, как правило, h ≤ 1).Допустим следующие экстремальные ситуации для ВКИСЭО и ВКШО:• все пользователи одновременно изменяют, создают или удаляют,соответственно, N , I или D записей в каждом ОЦ;• в каждом ОЦ одинаковое количество учащихся ( U );111• R – количество ОЦ.Тогда количество изменяемых/создаваемых/удаляемых записей во всех ОЦВКИСЭО/ВКШО будет следующим:• в ВКИСЭО:o количество изменяемых записей равно: R × U × N × (1 + h) , посколькусостоит из следующих количеств измененяемых записей: R × U × N – количество измененных первичных записей; R × U × N × h – количество измененных вторичных записей.o количество создаваемых записей равно: R × U × I × (1 + h) , посколькусостоит из следующих количеств создаваемых записей: R × U × I – количество созданных первичных записей; R × U × I × h – количество созданных вторичных записей.o количество удаляемых записей равно: R × U × D × (1 + h) , посколькусостоит из следующих количеств удаляемых записей: R × U × T – количество удаляемых первичных записей; R × U × T × h – количество удаляемых вторичных записей.• в ВКШО:o количество изменяемых записей равно: R × U × N .o количество создаваемых записей равно: R × U × I .o количество удаляемых записей равно: R × U × D .Таким образом, получается, что ВКШО в (1+h) раз превосходит ВКИСЭОпо количеству изменяемых/создаваемых/удаляемых записей.
И эта разница, вобщемслучае,независитотколичестваОЦ,пользователейилиизменяемых/создаваемых/удаляемых записей, а зависит только от возможногоколичества задействованных ОЦ в первичной записи, в которых создаютсявторичные записи. Но, учитывая, что в ВКИСЭО, как правило, h ≤ 1, то,получается, что ВКШО превосходит максимум в 2 раза. Кроме того, если впервичной записи изменяются значения атрибутов, изменения которых непереносятся во вторичные записи, то количество изменяемых записей в ВКИСЭО112и ВКШО будет совпадать, поскольку в ВКИСЭО будут изменяться толькопервичныезаписи.Такимобразом,получается,чтовВКИСЭОприсоздании/удалении первичной записи потребуется изменить максимум в 2 разабольше записей, чем в ВКШО [54]. А при изменении первичной записи вВКИСЭО потребуется изменить либо минимум столько же записей, как в ВКШО,либо максимум в 2 раза больше записей, чем в ВКШО [54].Если учесть, что большинство манипуляций с БД связаны с поискомданных, то преимущество ВКИСЭО очевидно из полученной оценки поискараспределенных данных [54].Сравнение разработанного в диссертации метода распределеннойобработки данных и прикладных процессов для ВКИСЭО с существующимиметодамиВ п.
2.2 проведен анализ существующих методов распределенной обработкиданных для эффективного функционирования ВКИСЭО, результаты которогопредставлены в таблице 2.1. Аналогичным образом сравним разработанный вдиссертации метод распределенной обработки данных для ВКИСЭО.Суть. Полученные результаты во 2-й и 3-й главе определяют суть этогометода: требования к ВКИСЭО, архитектура, модели и алгоритмы для ВКИСЭО.Достоинства. Нормальная вычислительная нагрузка в каждом ОЦ,поскольку её сервер частично загружен данными из других ОЦ.
В общем случае,при поиске/создании/изменении/удалении данных задействованы только те ОЦ,которые к ним относятся. Поэтому это благоприятно сказывается на сетевомтрафике. Полученная оценка эффективности при поиске записей показала, чтоувеличение количества ОЦ нормально сказывается на функционированииВКИСЭО, чем в ВКШО. Новые записи (или их изменения) вносятся снезначительными задержками, поскольку в этот момент должны быть доступнытолько те ОЦ, которые имеют отношение к этим записям.