Диссертация (1150736), страница 28
Текст из файла (страница 28)
Sep. URL: "http://hal.inria.fr/inria-00617718".49. HoldingsA.Cortex-R5Type Register.TechnicalReferenceManual:c0,MPU"[Online; accessed 20-Sep-2016]". URL: "http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.ddi0337e/BIHHGADD.html".50. Holdings A. Cortex-A5 Processor."[Online; accessed 20-Sep-2016]".URL: "http://www.arm.com/products/processors/cortex-a/cortex-a5.php".51. Holdings A. Cortex-R5 Processor."[Online; accessed 20-Sep-2016]".URL: "http://www.arm.com/products/processors/cortex-r/cortex-r5.php".52.
Yamauchi H., Wolczko M. Writing Solaris device drivers in Java // Proceedings of the 3rd workshop on Programming languages and operating systems:linguistic support for modern operating systems / ACM. 2006. p. 3.17553. Hunt G. C., Larus J. R. Singularity: Rethinking the Software Stack // SIGOPSOper. Syst. Rev. New York, NY, USA, 2007.
apr. Vol. 41, no. 2. P. 37–49.URL: http://doi.acm.org/10.1145/1243418.1243424.54. The Jikes research virtual machine project: building an open-source researchcommunity / B. Alpern, S. Augart, S. M. Blackburn et al. // IBM SystemsJournal. 2005. Vol. 44, no.
2. P. 399–417.55. Effort J. N. O. S. D. JNode. "[Online; accessed 20-Sep-2016]". URL: "http://jnode.org/".56. Cierniak M., Corporation I. The Open Runtime Platform: A Flexible HighPerformance Managed Runtime Environment // Intel Technology Journal.2003. Vol. 7. P.
5–18.57. Hertz M., Berger E. D. Quantifying the performance of garbage collection vs.explicit memory management // ACM SIGPLAN Notices / ACM. Vol. 40.2005. P. 313–326.58. Bacon D. F., Cheng P., Rajan V. The Metronome: A simpler approach togarbage collection in real-time systems // On the Move to Meaningful InternetSystems 2003: OTM 2003 Workshops / Springer. 2003. P. 466–478.59. Oracle.
Sun SPOT Dev. "[Online; accessed 20-Sep-2016]". URL: "http://www.sunspotdev.org/".60. Research M. Micro.NET. "[Online; accessed 20-Sep-2016]". URL: "http://netmf.codeplex.com/".61. Foundation A. Apache Public License 2.0. 2004. "[Online; accessed 20-Sep2016]". URL: "http://www.apache.org/licenses/LICENSE-2.0".62. Built-in Self-Test for Digital Integrated Circuits / V.
D. Agrawal, C.-J. Lin,P. W. Rutkowski et al. // AT&T Technical Journal. 1994. Vol. 73, no. 2.P. 30–39. URL: http://dx.doi.org/10.1002/j.1538-7305.1994.tb00576.x.17663. Leiserson C. E., Saxe J. B. Retiming synchronous circuitry // Algorithmica.1991.
Vol. 6, no. 1-6. P. 5–35.64. The synchronous data flow programming language LUSTRE / N. Halbwachs,P. Caspi, P. Raymond et al. // Proceedings of the IEEE. 1991. Vol. 79, no. 9.P. 1305–1320.65. Berry G., Gonthier G. The Esterel synchronous programming language: Design, semantics, implementation // Science of computer programming. 1992.Vol. 19, no.
2. P. 87–152.66. ThiesW.,KarczmarekguageforStreamingCompilerConstruction.M.,AmarasingheApplications//Grenoble,S.StreamIt:InternationalFrance:ALan-Conference2002.Apr.onURL:http://groups.csail.mit.edu/commit/papers/02/streamit-cc.pdf.67. Gilles K. The semantics of a simple language for parallel programming // InInformation Processing‘74: Proceedings of the IFIP Congress. Vol.
74. 1974.P. 471–475.68. Lee E. A. The Problem with Threads // Computer. Los Alamitos, CA, USA,2006. Vol. 39. P. 33–42.69. Netzer R. H. B., Miller B. P. Improving the accuracy of data race detection //Proceedings of the third ACM SIGPLAN symposium on Principles and practiceof parallel programming. PPOPP ’91. New York, NY, USA: ACM, 1991.P. 133–144. URL: http://doi.acm.org/10.1145/109625.109640.70.
SLAM2: static driver verification with under 4E. Bounimova, R. Kumar et al. //Proceedings of the 2010 Conference on Formal Methods in Computer-AidedDesign. FMCAD ’10. Austin, TX: FMCAD Inc, 2010. P. 35–42. URL:http://dl.acm.org/citation.cfm?id=1998496.1998508.71. Cousot P. Abstract Interpretation // ACM Computing Surveys.
New York, NY,USA, 1996. Vol. 28, no. 2. P. 324–328.72. Локуциевский О.В., Гавриков М.Б. Начала численного анализа."Янус 1995. URL: https://books.google.ru/books?id=-htEywAACAAJ.177ТОО73. Synopsys. DesignWare datapath building blocks. "[Online; accessed 20-Sep2016]". URL: "https://www.synopsys.com/dw/buildingblock.php".74. Parhi K. K., Messerschmitt D. G.
Static rate-optimal scheduling of iterativedata-flow programs via optimum unfolding // IEEE Transactions on Computers.1991. Feb. Vol. 40, no. 2. P. 178–195.75. Chang W.-H., Nguyen T. On the Fixed-Point Accuracy Analysis of FFT Algorithms // Signal Processing, IEEE Transactions on. 2008.
Oct. Vol. 56, no. 10.P. 4673–4682.76. Hsiao C.-F., Chen Y., Lee C.-Y. A generalized mixed-radix algorithm formemory-based FFT processors // Circuits and Systems II: Express Briefs, IEEETransactions on. 2010. Vol. 57, no. 1. P. 26–30.77. Gardner W. G. Efficient convolution without input/output delay // Audio Engineering Society Convention 97 / Audio Engineering Society. 1994.78.
Ammar G. S., Gragg W. B. Numerical experience with a superfast real Toeplitzsolver // Linear Algebra and its Applications. 1989. Vol. 121. P. 185–206.79. Smith S. J. Lebesgue constants in polynomial interpolation // Annales Mathematicae et Informaticae / Eszterházy Károly College, Institute of Mathematicsand Computer Science. 33 no. 109-123. 2006. P. 1787–5021.80. MATLAB. version 8.0.0 (R2012b). Natick, Massachusetts: The MathWorksInc., 2012.81. Dantzig G. Linear programming and extensions. Princeton Univ. Press, 1963.aug. URL: "http://www.amazon.com/exec/obidos/redirect?tag=citeulike07-20&path=ASIN/0691059136".82. Klee V., Minty G.
J. How good is the simplex algorithm? // Inequalities / Ed.by O. Shisha. New York: Academic Press, 1972. Vol. III. P. 159–175.83. Schrijver A. Theory of Linear and Integer Programming. New York, NY, USA:John Wiley & Sons, Inc., 1986.17884. Karmarkar N. A New Polynomial-time Algorithm for Linear Programming //Proceedings of the Sixteenth Annual ACM Symposium on Theory of Computing. STOC ’84. New York, NY, USA: ACM, 1984. P. 302–311. URL:"http://doi.acm.org/10.1145/800057.808695".85.
Procedures for Optimization Problems with a Mixture of Bounds and GeneralLinear Constraints / P. E. Gill, W. Murray, M. A. Saunders et al. // ACM Trans.Math. Softw. New York, NY, USA, 1984. Vol. 10, no. 3. P. 282–298. URL:"http://doi.acm.org/10.1145/1271.1276".179Приложение AМетоды оптимизацииэнергопотребленияДадим краткое описание оптимизаций энергопотребления на различныхуровнях и затем развернутое описание некоторых техник архитектурного исистемного уровня.A.1Уменьшение напряжения питанияСогласно 1.1, динамическая мощность пропорциональна квадрату напряжения. Потеря мощности от токов утечки линейно зависит от напряженияпитания. Таким образом, уменьшение напряжения питания приводит к уменьшению мощности устройства.
Понижение напряжения питания является наиболее значимым механизмом уменьшения энергопотребления. Обратной стороной понижения напряжения питания являются понижение надежности и задержки переключения вентилей в результате разброса параметров устройствв процессе изготовления, приводящие к понижению частоты. Для сохранениянеобходимой вычислительной производительности используются различныеметоды распараллеливания.
Для эффективного распараллеливания требуетсямодификация или разработка новых алгоритмов, допускающих параллельноеисполнение.180A.2Несколько напряжений питанияВ некоторых случаях напряжение питания отдельных частей схемы не может быть понижено вследствие ограничений на минимальное быстродействиеили необходимость сопряжения с внешними цепями за пределами кристалла. Другим подходом является уменьшение напряжения питания в отдельныхцепях схемы. При этом пути с меньшей задержкой могут иметь меньшее питание.
Разделение по уровню питания может происходить на модульном уровне,когда различные модули имеют разные требования к быстродействию. Например, в случае схемы, состоящей из контроллера и вычислительного акселератора, если контролер при одинаковом напряжении питания имеет меньшийкритический путь, то его напряжение питания может быть уменьшено для выравнивания критических путей. Для согласования уровней напряжения между взаимодействующими схемами требуется вставка конвертеров напряжения.Кроме того, требуется наличие дополнительных напряжений в схеме питания.Наличие дополнительных компонент уменьшает выигрыш от использованияразличных напряжений питания и существенно затрудняет процесс разработки полупроводникового кристалла. Несколько напряжений питания обычноиспользуются совместно с несколькими частотами тактирования.A.3Масштабирование транзисторовВходная емкость вентиля пропорциональна ширине затворов транзисторов, подключенных ко входу.
Оптимальная ширина затвора пропорциональнатребуемой скорости переключения управляемой нагрузки. Для уменьшениявходной емкости транзисторы могут быть масштабированы на путях с малойзадержкой. Поскольку размер транзисторов в КМОП вентиле связан с балансировкой различных путей внутри вентиля, это приводит к масштабированиювсего вентиля. При уменьшении ширины затвора задержка на пути распространения сигнала увеличивается, что приводит к изменению критическихпутей в схеме. Данная оптимизация обычно выполняется автоматическимисистемами синтеза топологии кристалла.181A.4Сдвиг потенциала подложкиСдвиг потенциала подложки используется для уменьшения тока утечки впростое.