> 教育经验 > 什么是粗粒度可重构架构的软错误自适应防护模型与方法研究介绍

什么是粗粒度可重构架构的软错误自适应防护模型与方法研究介绍

什么是粗粒度可重构架构的软错误自适应防护模型与方法研究介绍

《粗粒度可重构架构的软错误自适应防护模型与方法研究》是依托上海交通大学,由绳伟光担任项目负责人的青年科学基金项目。

粗粒度可重构架构的软错误自适应防护模型与方法研究项目摘要

粗粒度可重构计算架构(CGRA)高并行、低功耗的特点使其在民用高效能与空间高可靠计算领域具有广阔的应用前景。但随着工艺尺寸的持续缩小,地面环境下同样面临日益严峻的软错误影响,这严重阻碍了CGRA架构在高性能高可靠领域的应用。因此本课题针对CGRA架构的软错误问题,探索功能与可靠性均可灵活重构的新型CGRA架构,研究适用不同领域、具有自适应能力的软错误防护方法。首先抽象CGRA的通用架构模型,籍此对软错误效应模型及评估方法进行研究;然后开展对各类软错误防护方法不同效果、相容性及相互作用的评估;构建具有自适应防护能力的CGRA架构模型及验证平台,最终给出CGRA通用架构下软错误自适应防护的一般方法。当前CGRA架构的软错误问题及自适应防护方法尚未得到充分关注,更缺乏高可靠环境下的应用研究,因此本课题对两者的结合必将推动CGRA架构软错误可靠性理论的发展,拓展其在高效能、高可靠计算领域的应用。

粗粒度可重构架构的软错误自适应防护模型与方法研究结题摘要

高效能的粗粒度可重构计算架构(CGRA)由于互连复杂、集成度高导致对软错误较为敏感,因此本课题对CGRA相关的软错误分析与防护问题进行了研究。首先对CGRA的通用架构模型进行了总结,给出了CPU+RPU(可重构计算单元)的通用可重构架构模型,构建了包含OR1200处理器核和由64个PE单元组成的RPU的粗粒度可重构处理器RORP,并进行了SystemC建模,可方便的用于后续软错误的研究,其中OR1200处理器的电子系统级ESL建模属首次完成。接下来,针对软错误率评估问题进行了深入研究,开发了一系列软错误率评估的方法及工具。为细致评估互连对系统软错误率的影响,开发了电路级的软错误率评估方法及工具ASSET-SPI;开发了快速评估门级网表电路软错误率的方法及工具ASSET-VLG;为快速评估复杂ESL级系统的软错误率开发了2套不同的SystemC级的仿真故障注入方法及工具,分别针对SystemC的Port与Signal进行仿真软错误注入。特别是针对SystemC的Signal进行软错误注入的巩固ASSET-SC,可以完全自动化进行软错误率的评估,具有方便、快捷的特点,相关方法尚未见报道。最后对CGRA的低代价容软错误加固技术进行了研究,针对CGRA的RPU包含大量计算单元的特点,对PE单元结构进行了改进,使得每个PE都可以作为三模冗余(TMR)的表决器,从而可以以很低的代价引入TMR加固机制。同时对其它容软错误加固机制如ECC也进行了探索。整体而言,本课题的研究发现:i)虽然组合逻辑电路的软错误日益受到重视,但当前触发器和存储器的软错误仍然居于主导地位,考虑到CGRA架构内部包含大量存储部件,对其软错误防护仍应集中于存储器件的保护;ii)互连对系统的软错误有明显的影响,对于简单电路如果不考虑互连,对软错误率的估计会导致严重偏差,但目前对于复杂片上系统如何评估互连对系统软错误率的影响仍是待解决的难题;iii)CGRA本身的结构特点为低代价的软错误防护提供了更广的设计探索空间,可靠性可配置的CGRA架构具有良好的研究与应用价值,本课题的研究结果对于CGRA架构在软错误方面的研究具有借鉴意义。