Предсказание потребления процессорного времени в виртуальных средах (1187413), страница 6
Текст из файла (страница 6)
Алгоритм планирования позволяет напрямую контролировать вероятность нехватки процессорного времени.Результаты, перечисленные в пункте 5 являются ключевыми дляэтой работы.40Отметим всю условность полученного прироста производительности. С одной стороны, планировщик был крайне ограничен в спектресвоих возможных действий. Имея свободу сопоставлять пары сервер –нагрузка для множества серверов и множества нагрузок, заведомо возможно получить результаты не хуже, чем когда за планировщика это сопоставление уже сделано волей случая.
С другой стороны, в ходе симуляции был сделан ряд упрощений. Главное упрощение состоит в рассмотрении исключительно потребления процессорного времени. В реальности,при балансировании нагрузки придётся учитывать также потреблениеоперативной памяти, операции с диском и использование сетевого канала. Детальное симулирование работы с оперативной памятью представляется куда более сложной задачей, чем отдельное рассмотрение процессорного времени. Другим упрощением является игнорирование возможной взаимной зависимости между нагрузками.
Наличие корреляциймежду потреблениями процессорного времени нагрузками на одной физической машине потенциально может увеличить вероятность нехватки процессорного времени, как следствие нарушения предположения онезависимости. С другой стороны, учёт связи нагрузок может позволитьучесть корреляцию в вероятностной моделе, и увеличить точность предсказания на счёт дополнительной информации от других нагрузок.Однако, целью работы была демострация возможности эффективно использовать предсказываемое вероятностное распределение для размещения нагрузки.
Точности модели предсказания хватило, чтобы наего основании планировщик мог добиватся желаемой вероятности перегрузки. В результате планировщик предоставлял желаемый контрольрисков, что подтверждает принципиальную применимость предложенной конструкции.41ЗаключениеДля максимальной точности предсказания потребления процессорного времени линейных моделей недостаточно, искусственные нейронныесети показывают значительно более высокую точность. В число независимых переменных крайне важно включить история потребления процессорного времени, но дополнительные параметры также дают некоторый прирост точности.Для обезопашенного от нехватки ресурсов распределения нагрузки, необходима не точечная оценка будущего потребления, а оценка всегоего вероятностного распределения. Наличие такой оценки для каждойнагрузки позволяет достаточно точно оценивать вероятность нехваткирассматриваемого ресурса, что экспериментально подтвердилось в ходеработы.
Для предсказания распределения можно использовать вариационные нейронные сети.В качетсве продолжения данной работы, разумно включить в рассмотрение другие системные ресурсы. Такое расширение, вероятно, потребует наличие более детальных исторических данных, либо доступ реально исполняемым нагрузкам. Конечной целью является эффективнаябалансировка реальных нагрузок.Использование более частых измерений может улучшить точностьпредсказания и уменьшить задержки в реагировании планировщика.Учёт взаимодействия между нагрузками также может увеличить точность.
И наконец, точность предсказания может быть возможно повычить с использованием рекуррентных нейронных сетей (хранящих внутреннее состояние).42Список литературы1. Dhiman Gaurav, Mihic Kresimir, Rosing Tajana. A system for online power prediction in virtualized environments using gaussian mixture models // Design Automation Conference (DAC), 2010 47thACM/IEEE / IEEE. — 2010. — Pp. 807–812.2.
Meisner David, Gold Brian T, Wenisch Thomas F. PowerNap: eliminating server idle power // ACM Sigplan Notices / ACM. — Vol. 44. —2009. — Pp. 205–216.3. Pakbaznia Ehsan, Pedram Massoud. Minimizing data center cooling andserver power costs // Proceedings of the 2009 ACM/IEEE internationalsymposium on Low power electronics and design / ACM. — 2009. —Pp. 145–150.4. Di Sheng, Kondo Derrick, Cirne Walfredo. Characterization and Comparison of Google Cloud Load versus Grids. http://hal. archives-ouvertes.fr/hal-00705858.
— 2012.5. Di Sheng, Kondo Derrick, Cirne Walfredo. Host load prediction in aGoogle compute cloud with a Bayesian model // Proceedings of theInternational Conference on High Performance Computing, Networking,Storage and Analysis / IEEE Computer Society Press. — 2012. — P. 21.6. Kalyvianaki Evangelia, Charalambous Themistoklis, Hand Steven. Adaptive resource provisioning for virtualized servers using Kalman filters //ACM Transactions on Autonomous and Adaptive Systems (TAAS). —2014. — Vol.
9, no. 2. — P. 10.7. Kalyvianaki Evangelia, Charalambous Themistoklis, Hand Steven. Selfadaptive and self-configured cpu resource provisioning for virtualizedservers using kalman filters // Proceedings of the 6th international conference on Autonomic computing / ACM. — 2009. — Pp. 117–126.8. Adaptive control of virtualized resources in utility computing environments / Pradeep Padala, Kang G Shin, Xiaoyun Zhu et al. // ACM43SIGOPS Operating Systems Review / ACM. — Vol. 41.
— 2007. —Pp. 289–302.9. Berger James O. Statistical decision theory and Bayesian analysis. —Springer Science & Business Media, 2013.10. Di Sheng, Kondo Derrick, Cirne Walfredo. Google hostload predictionbased on Bayesian model with optimized feature combination // Journalof Parallel and Distributed Computing. — 2014. — Vol. 74, no. 1. —Pp. 1820–1832.11. Dinda Peter A, O’Hallaron David R. An evaluation of linear models forhost load prediction // High Performance Distributed Computing, 1999.Proceedings. The Eighth International Symposium on / IEEE. — 1999.— Pp.
87–96.12. Dinda Peter A. The statistical properties of host load // InternationalWorkshop on Languages, Compilers, and Run-Time Systems for ScalableComputers / Springer. — 1998. — Pp. 319–334.13. Dinda Peter A, O’hallaron David R. Host load prediction using linearmodels // Cluster computing. — 2000. — Vol. 3, no. 4. — Pp.
265–280.14. Domingos Pedro, Pazzani Michael. On the optimality of the simpleBayesian classifier under zero-one loss // Machine learning. — 1997.— Vol. 29, no. 2. — Pp. 103–130.15. Dunham Margaret H. Data mining: Introductory and advanced topics.— Pearson Education India, 2006.16.
Farahat MA, Talaat M. Short-Term Load Forecasting Using Curve Fitting Prediction Optimized by Genetic Algorithms // International Journal of Energy Engineering. — 2012. — Vol. 2, no. 2. — Pp. 23–28.17. Kalyvianaki Evangelia, Hand Steven. Applying Kalman filters to dynamic resource provisioning of virtualized server applications // Proc. 3rd Int.Workshop Feedback Control Implementation and Design in ComputingSystems and Networks (FeBid). — 2008.
— P. 6.4418. Adaptive workload prediction of grid performance in confidence windows / Yongwei Wu, Kai Hwang, Yulai Yuan, Weiming Zheng // IEEETransactions on Parallel and Distributed Systems. — 2010. — Vol. 21,no. 7. — Pp. 925–938.19. Load prediction using hybrid model for computational grid / Yongwei Wu, Yulai Yuan, Guangwen Yang, Weimin Zheng // Grid Computing, 2007 8th IEEE/ACM International Conference on / IEEE. — 2007.— Pp. 235–242.20. Yoas Daniel W, Simco Greg.
Resource utilization prediction: A proposalfor information technology research // Proceedings of the 1st Annualconference on Research in information technology / ACM. — 2012. —Pp. 25–30.21. Zhang Yuanyuan, Wei SUN, Inoguchi Yasushi. CPU load predictions onthe computational grid // IEICE TRANSACTIONS on Information andSystems. — 2007. — Vol. 90, no. 1. — Pp. 40–47.22. Bellosa Frank. The benefits of event: driven energy accounting in powersensitive systems // Proceedings of the 9th workshop on ACM SIGOPSEuropean workshop: beyond the PC: new challenges for the operatingsystem / ACM.
— 2000. — Pp. 37–42.23. Contreras Gilberto, Martonosi Margaret. Power prediction for Intel XScale/spl reg/processors using performance monitoring unit events // LowPower Electronics and Design, 2005. ISLPED’05. Proceedings of the 2005International Symposium on / IEEE. — 2005. — Pp.
221–226.24. Li Tao, John Lizy Kurian. Run-time modeling and estimation of operating system power consumption // ACM SIGMETRICS PerformanceEvaluation Review / ACM. — Vol. 31. — 2003. — Pp. 160–171.25. ClusterData2011_2 traces. — https://github.com/google/cluster-data/blob/master/ClusterData2011_2.md. — Accessed: 22.05.2017.26. Hornik Kurt. Approximation capabilities of multilayer feedforward networks // Neural networks.
— 1991. — Vol. 4, no. 2. — Pp. 251–257.4527. Murphy Kevin P. Machine learning: a probabilistic perspective. — MITpress, 2012.28. Dropout: A simple way to prevent neural networks from overfitting /Nitish Srivastava, Geoffrey Hinton, Alex Krizhevsky et al. // The Journalof Machine Learning Research. — 2014.
— Vol. 15, no. 1. — Pp. 1929–1958.29. Baldi Pierre, Sadowski Peter J. Understanding dropout // Advances inNeural Information Processing Systems. — 2013. — Pp. 2814–2822.30. Ioffe Sergey, Szegedy Christian. Batch normalization: Accelerating deepnetwork training by reducing internal covariate shift // arXiv preprintarXiv:1502.03167. — 2015.31. Kudinova Marina, Melekhova Anna, Verinov Alexander.
CPU utilization prediction methods overview // Proceedings of the 11th Central &Eastern European Software Engineering Conference in Russia / ACM.— 2015. — P. 7.32. Bobroff Norman, Kochut Andrzej, Beaty Kirk. Dynamic placement ofvirtual machines for managing sla violations // Integrated Network Management, 2007. IM’07. 10th IFIP/IEEE International Symposium on /IEEE. — 2007. — Pp.