上海交通大学学报

Select

纳米级集成电路的软错误问题及其对策

张民选, 孙岩, 宋超

2013,47 (01): 1-6.

摘要 ( 2759 )

介绍了纳米级集成电路中软错误的发生机制、发展趋势以及评估技术，概括了软件、电路和体系结构以及工艺器件级软错误的缓解对策，并针对软错误问题相关研究的发展提出几点建议.

参考文献 | 相关文章 | 计量指标

Select

面向有限目标集的无冲突无线射频识别技术

李小芳, 张民选, 徐炜遐

2013,47 (01): 7-12.

摘要 ( 2351 )

为了解决多目标识别问题，提出了一种基于频分多址、面向有限目标集的无冲突无线射频识别(RFID)技术，并通过了模拟实验的验证.结果表明，所构建的RFID系统具有无冲突、识别速度快、灵敏度高等优点，适用于电子物品监视、幼儿园管理等目标集大小有限的应用领域.

参考文献 | 相关文章 | 计量指标

Select

一种新型缓冲结构——支持无死锁的完全自适应路由

肖灿文, 张民选

2013,47 (01): 13-17.

摘要 ( 2818 )

摘要：
介绍了一种适用于虫孔切换网络的多请求输入缓冲区组织的新型缓冲区结构.该结构支持Duato方法在报文穿插存储情况下实现无死锁的完全自适应路由.同时，基于BookSim模拟平台，对多请求输入缓冲区结构的性能进行评价.结果表明，新型多请求输入缓冲区结构的性能优于先进先出（FIFO）缓冲结构，其在uniform通信模式下的报文延迟降幅近68%. 关键词：
虫孔切换； Duato方法；无死锁适用性路由；多请求输入缓冲区结构中图分类号： TN 913
文献标志码： A

参考文献 | 相关文章 | 计量指标

Select

一种基于2D-mesh的片上网络无死锁容错路由算法

周磊1, 2, 吴宁1, 李云2

2013,47 (01): 18-22.

摘要 ( 3489 )

为解决片上网络中的永久性故障问题，提出一种基于2D-mesh拓扑结构的无死锁容错路由算法.定义了新的故障块生成规则，减小了故障节点的区域和受影响的健康节点数目，设计了一种故障节点探测和绕道路径生成算法，通过递归式消息传递实现了故障块区域的建立和绕道路径列表的生成.在绕道容错路由算法中，采用部分路由表与路由规则相结合的方法，通过在报头中加入绕道路径列表的方式引导报文绕过故障区域.结果表明，与现有算法相比，所提出的容错路由算法在随机均衡负载和热点负载2种情况下的延时都有所降低.

参考文献 | 相关文章 | 计量指标

Select

面向微处理器时钟发布的硅基无线发射器设计

李晋文, 何小威, 张民选

2013,47 (01): 23-27.

摘要 ( 2390 )

基于硅基天线和电磁波传输的无线互连技术，设计实现了一种面向微处理器的无线时钟分布发射器电路，包括一个长2.6 mm、宽30 μm、集成在硅衬底（电阻率为10 Ω·cm）上的偶极折叠天线、高频锁相环、驱动和匹配电路.其中，硅基折叠天线提高了芯片的面积利用率，并通过在硅衬底与散热金属之间引入金刚石介质来提高折叠天线的传输增益.同时，为了减小信号传输功率的损失，在电路与硅基天线之间进行了阻抗共轭匹配，设计实现了中心工作频率11 GHz的低噪声锁相环，在频率偏移为3、10 MHz处的相位噪声分别达-116、-127 dBc/Hz.结果表明，所设计的发射器有效面积为0.85 mm2，能够提供低抖动、稳定的高频全局时钟源.

参考文献 | 相关文章 | 计量指标

Select

面向序列密码的非线性反馈移位寄存器可重构并行化设计

陈韬1, 杨萱2, 戴紫彬1, 李伟1, 陈迅1

2013,47 (01): 28-32.

摘要 ( 3022 )

摘要：
基于序列密码的非线性反馈移位寄存器，将可重构技术与并行化处理相融合，提出了一种非线性反馈移位寄存器的可重构并行化架构.结果表明：可重构并行化架构能够灵活重构任意结构的非线性反馈移位寄存器；并行化思想能够支持在一个时钟周期完成对非线性反馈移位寄存器的并行更新；在0.18 μm的互补金属氧化物半导体（CMOS）工艺中，其核心工作频率能够达到172 MHz，针对256级的线性反馈移位寄存器，当并行度选取为32时，其吞吐率能够达到5.5 Gb/s. 关键词：
序列密码；非线性反馈移位寄存器；可重构；并行化中图分类号： TN 492
文献标志码： A

参考文献 | 相关文章 | 计量指标

Select

65 nm体硅CMOS工艺器件尺寸对其脉冲削减效应的影响

李鹏, 赵振宇, 郑超, 张民选

2013,47 (01): 33-38.

摘要 ( 2290 )

利用电路级模拟方法，在65 nm体硅CMOS工艺条件下研究了器件尺寸对其脉冲削减效应的影响.结果表明，当被动反相器的尺寸改变时，脉冲削减效应的变化趋势与其内部双极放大效应的强弱有关.在双极放大效应较强时，脉冲削减效应随尺寸的增加而增强；反之，则其脉冲削减效应随尺寸的增加而减弱.

参考文献 | 相关文章 | 计量指标

Select

可靠性感知的片上网络链路管理策略

焦佳佳, 付宇卓

2013,47 (01): 39-43.

摘要 ( 3174 )

在保证片上网络通信性能和可靠性的条件下，根据应用的通信可预测特性和容错需求，提出了可靠性感知的片上网络链路关闭策略，设计了对应的路由算法.同时，以典型的多媒体应用VOPD为例，与无链路管理配置的Mesh结构加以对比，以验证面向应用可靠性感知的片上网络链路管理策略的有效性和可行性.结果表明，所提出的可靠性感知的片上网络链路管理策略不仅可以充分发挥部分定制的优势，而且可以关闭选择的链路和对应的端口时钟，从而节省了片上网络的功耗开销，并获得30%的综合指标收益.

参考文献 | 相关文章 | 计量指标

Select

动态可重构众核处理器仿真平台设计

韩兴, 蒋江, 付宇卓, 周川, 刘子扬, 杨凯凯

2013,47 (01): 44-48.

摘要 ( 3047 )

针对众核处理器，提出了一种基于计算资源划分机制的动态可重构技术.该技术以虚拟计算群为核心，设计了基于硬件支持的动态可重构子网划分和动态可重构的Cache一致性协议以及动态在线的计算资源调度算法，并对系统级多核仿真平台Gem 5进行了扩展.同时，采用实际测试结果验证了众核处理器中动态可重构技术的有效性.结果表明，动态可重构技术可以提高众核处理器的资源利用率,实现动态可重构的Cache一致性协议以及单一矩形物理子网覆盖的子网划分机制.

参考文献 | 相关文章 | 计量指标

Select

优化迁移共享的自适应令牌协议

付桂涛1, 2, 赵天磊1, 唐川1, 邢座程1

2013,47 (01): 49-54.

摘要 ( 2546 )

针对写作废的一致性协议在处理迁移特征时需要2次访问的特征，提出了一种自适应的令牌协议，根据数据的读/写处理器和数据的令牌信息判断数据是否具有迁移特征.如果数据具有迁移特征，则请求者的状态变为可以避免迁移访问序列中出现写访问的状态MG，从而消除了迁移特征中的写作废次数.结果表明，所提出的自适应令牌协议在读访问时获取了数据所有权，避免了部分写失效的产生，从而使得平均失效延迟降低5%，通信量平均降低9%.

参考文献 | 相关文章 | 计量指标

Select

基于复用测试逻辑方法的集成电路硅调试设计方案

张明, 高军, 张民选

2013,47 (01): 55-59.

摘要 ( 2363 )

提出了一种集成电路芯片的硅调试设计方案.采用具有短链扫描结构的扫描链复用方法，以提高对芯片触发器类信息的读写速度，为存储器内建自测试（MBIST）控制器增加异步通信调试接口，以提高静态存储器类信息的访问速度，同时，简化了MBIST控制器的物理设计难度.结果表明，所提出的硅调试设计方法可以降低硬件资源的消耗，使得调试软件设计的难度和复杂度显著降低，并使得硅调试的相关操作更加简便.

参考文献 | 相关文章 | 计量指标

Select

片上网络任务映射算法的可靠性优化

刘婷, 乌耀益, 付宇卓

2013,47 (01): 60-64.

摘要 ( 3192 )

为了满足当前特定应用领域对片上网络可靠性的要求，在贪心启发式映射算法的基础上，通过加入基于容错机制可靠的通信开销函数约束，实现了一种具有可靠性的片上网络任务映射算法RaNMAP.结果表明，该映射算法可以有效提高片上网络系统的可靠性，有利于从更高的抽象层次对片上网络的容错设计进行指导和评估.

参考文献 | 相关文章 | 计量指标

Select

一种基于三维堆叠技术的高可靠性Cache结构

孙岩, 宋超, 黎铁军, 张民选

2013,47 (01): 65-69.

摘要 ( 3028 )

针对三维集成电路的软错误问题，分析了高能粒子进入三维堆叠芯片中的运行轨迹和特性，在分析高速缓冲存储器（Cache）中各部分软错误易感性的基础上，提出了一种基于三维堆叠技术的高可靠性Cache结构R3DCache，利用三维堆叠芯片的层间屏蔽效应，以较小的面积和性能开销大幅降低了其软错误率.结果表明，所提出的R3DCache结构能够以0.52%~4.17%的面积开销，将Cache的软错误率降低到原来的5%，而所带来的性能开销可以忽略.

参考文献 | 相关文章 | 计量指标

Select

异构环境下的空间分析并行映射策略

张剑波, 周斯波, 袁国斌, 石阳, 朱建勃

2013,47 (01): 70-75.

摘要 ( 2515 )

针对传统的地图代数局部算子实现方法用于海量栅格数据计算时效率低下的问题，从串行算法的并行化映射、计算机图形处理器资源的自适应参数调整等角度分析地图代数空间并行算法的实现机制，采用数据分割策略对空间分析算子的计算速度进行分析，将空间分析算子分割成若干子任务，并映射到图形处理器（GPU）中进行运算，通过运算与数据传输的重叠隐藏数据传输时间，借助异构环境计算能力的强大而加速算子的运算.理论分析与实验结果表明，该策略能够明显提高空间分析算子的运算速度.

参考文献 | 相关文章 | 计量指标

Select

基于模拟退火算法的浮点转定点自动位宽优化工具

黎渊1, 蒋江2, 张民选1, 魏少军3

2013,47 (01): 76-80.

摘要 ( 2553 )

开发了一套浮点转定点自动位宽优化软件系统(SATRANS)，能够将用户输入的描述目标系统的浮点程序自动转换为位宽可配置的定点程序，并基于模拟退火算法进行自动位宽搜索，以得到满足精度要求的操作数定点位宽组合.同时，以IIR数字滤波器为例对SATRANS进行了实现与验证.结果表明，SATRANS的搜索结果优于传统贪心算法的搜索结果，并能够获得一系列满足精度要求的解,从而使得芯片设计人员能够在精度与复杂度等要素之间加以权衡，并选择一组最合适的位宽组合而用于芯片设计中.选择搜索结果中的面积最优解来配置IIR系统并在Xilinx Virtex6 FPGA芯片中实现，相对于IEEE浮点单/双精度系统，其性能分别提高了12.4%和62.8%，面积的降幅分别为93.9%和97.9%.

参考文献 | 相关文章 | 计量指标

Select

采用数据驱动机制的多核处理器

毕卓a, 徐云川b, 王镇b

2013,47 (01): 81-85.

摘要 ( 2273 )

摘要：
针对当前工艺条件下多核处理器存在程序并行性不足的问题，设计了一种采用数据驱动机制、支持函数语言风格编程的多核处理器，包括通用处理器核、数据驱动模块和片内路由器.其中：通用处理器核用于执行常规程序；数据驱动模块用于检测数据的完备性；片内路由器则可提供处理器核之间及簇之间的通信.实验结果表明，所设计的多核处理器能够支持C语言“函数式语言”风格的编程模板.每个C代码段执行纯函数的操作，消除了函数间的共享变量，使得并行编程的复杂度有所降低.同时，所采用的数据驱动机制没有执行顺序的严格限制，充分挖掘了算法潜在的并行性.经测试，数据驱动多核处理器的加速比随着计算资源的增加而增大，从而验证了数据流计算机的加速倍数随处理器数目增加而线性增长的结论.
关键词：
数据驱动；并行编程模型；数据流机；多核处理器
中图分类号： TP 338
文献标志码： A

参考文献 | 相关文章 | 计量指标

Select

一种面向三维微处理器的新型片上网络拓扑

王谛1, 白晗2, 赵天磊1, 唐遇星1, 窦强1

2013,47 (01): 86-91.

摘要 ( 2622 )

利用三维集成电路中硅通孔具有延迟短、功耗低的特性，针对10层以上硅片堆叠的三维片上网络，设计了一种新的拓扑结构3DEMesh，并通过实验数据的分析，验证了3DEMesh的性能和可扩展性.结果表明，3DEMesh的性能和可扩展性均满足10层以上硅片堆叠的三维集成电路的要求.

参考文献 | 相关文章 | 计量指标

Select

片上网络中基于拓扑排序的死锁检测与恢复方法

乔寓然, 伍楠, 杨乾明, 文梅, 张春元

2013,47 (01): 92-97.

摘要 ( 3168 )

提出了一种将拓扑排序应用于片上网络的死锁检测与恢复的方法.利用片上网络线资源丰富的特点，使用专用线路采集并分析网络中各通道之间的依赖关系，快速确定处于死锁环路中的通道位置，并对死锁环路进行解锁.结果表明，所提出的方法简单有效，可以支持各种路由算法，与广泛应用的死锁避免策略相比，其网络资源的利用率和网络性能有所提高，并具有一定的容错能力.

参考文献 | 相关文章 | 计量指标

Select

数字微流控生物芯片的并行在线测试

张玲1, 2, 邝继顺2, 林静3, 梅军进1

2013,47 (01): 98-102.

摘要 ( 2941 )

在数字微流控生物芯片的并行测试过程中，将芯片阵列分成等大的子阵列块，在生物实验模块布局的限制下,对相应的子阵列块进行合并与调度,以实现芯片阵列的并行测试.同时，通过实验验证了并行在线测试方法的有效性.结果表明，在不干扰生物实验过程的基础上，所采用的测试方法能够减少测试液滴的数目，提高在线测试的效率.

参考文献 | 相关文章 | 计量指标

Select

一种全系统模拟器片上缓存动态功耗分析工具

黄智濒, 祝明发, 肖利民

2013,47 (01): 103-107.

摘要 ( 3595 )

通过分析各种缓存逻辑结构和管理策略条件下的访存行为而得出5个原子操作；依据其对缓存数据阵列和标记阵列及其内部结构的操作，估算了原子操作的动态功耗并统计出缓存的动态功耗；基于修改的Cacti 6.5软件计算缓存数据阵列和标记阵列及其内部结构的功耗参数，提出了一种可用于全系统模拟器Simics的缓存动态功耗分析工具PowerGC.同时，经多组实验验证了PowerGC性能的有效性.结果表明，PowerGC可以有效评估Simics中各种缓存逻辑结构和管理策略的动态功耗.

参考文献 | 相关文章 | 计量指标

Select

频率2 GHz的16核处理器二级缓存设计

李永进, 邓让钰, 晏小波, 衣晓飞, 周宏伟, 张英

2013,47 (01): 108-112.

摘要 ( 2579 )

摘要：
提出了针对多核处理器的2级缓存L2 Cache设计方案，以高效地处理访存请求.采用优化的目录协议维护与1级缓存L1 Cache的数据一致性，并结合片上目录来维护L2 Cache之间及其与3级缓存L3 Cache之间的一致性；在L2 Cache设计中，提出了基于MESIAF的Cache一致性协议，实现了最早返回取数数据的短流水线设计；采用相关链和远程链机制解决了监听应答导致的死锁问题；通过基于流水线的睡眠与唤醒技术降低了漏流功耗；通过细粒度门控时钟降低了其动态功耗.后端设计结果表明，经过优化设计的L2 Cache达到了频率2 GHz的设计目标，并已成功应用于某16核处理器芯片. 关键词：
中图分类号：文献标志码： A

参考文献 | 相关文章 | 计量指标

Select

面向高性能计算的混合存储系统设计与实现

宋振龙, 李琼, 徐炜瑕, 李晋文, 刘光明

2013,47 (01): 113-117.

摘要 ( 2858 )

提出了一种采用RAM-disk的混合存储系统，在计算节点的并行文件系统的元数据服务器和对象存储服务器组件中设置不同用途的RAM-disk，用于缓存各种访问模式的文件并提高系统的读写性能.结果表明，采用RAM-disk的混合存储系统可以明显提高系统的读写性能，同时可提高系统的可用性和可维性.

参考文献 | 相关文章 | 计量指标

Select

CSP多核处理器芯片的低功耗设计

高军, 王永文, 郭维, 黄安文

2013,47 (01): 118-122.

摘要 ( 2724 )

提出了3种高主频多核处理器CSP芯片的功耗优化技术，即电源域间隔关断技术、流量感知的动态频率调节技术和层次式门控时钟技术.结果表明，3种优化技术对降低芯片功耗的作用均非常有效，能够不同程度地降低芯片的总功耗.其中，电源域间隔关断技术能够解决静态漏流功耗，流量感知的动态频率调节技术和层次式门控时钟技术能够控制动态功耗.

参考文献 | 相关文章 | 计量指标

Select

一种高速缓冲存储器的可综合伪随机功能验证方法

张建民, 张峻, 夏军, 庞征斌, 徐炜遐

2013,47 (01): 123-128.

摘要 ( 2915 )

针对微处理器的高速缓冲存储器（Cache），提出了一种可综合的伪随机功能验证方法，对其在实际芯片中的性能进行测试，并与常见的基于软件模拟的随机功能验证方法进行了对比.结果表明，与基于软件模拟的伪随机功能验证方法相比，所提出的可综合伪随机验证方法的处理速度快约3个数量级，并且能够发现更多的功能错误.

参考文献 | 相关文章 | 计量指标

Select

改善辐照加固设计流水线型模数转换器性能的抖动电路技术

余金山1, 2, 梁盛铭2, 马卓1, 王育新2, 张瑞涛2刘涛2, 李婷2, 俞宙2

2013,47 (01): 129-133.

摘要 ( 2512 )

提出了一种能够改善高精度辐照加固设计流水线型模数转换器（ADC）动态性能指标的减式抖动电路技术.其中，基于深度伪随机数生成器所产生的伪随机数来驱动高精度数模转换器而生成所需的抖动信号，将抖动信号与ADC的输入信号相加输送给ADC进行量化，并将抖动信号从ADC量化输出中减去，以降低ADC的信噪

参考文献 | 相关文章 | 计量指标

Select

一种基于代码隔离的大程序迭代编译优化方法

陆平静, 李宝, 车永刚, 庞征斌

2013,47 (01): 133-137.

摘要 ( 2632 )

提出了一种轻权的大程序优化方法——基于代码隔离的迭代编译优化方法，并采用该方法对程序的性能进行测试，结合代码隔离技术，从大程序中分离若干以循环结构为主、性能不相关或相关度较低的核心代码片断，逐个对其进行迭代编译优化搜索，进而更加有效地优化核心代码段.结果表明，所提出的方法可以提高整个程序的性能，可将一个高维的优化空间转换为多个低维优化空间而降低迭代编译的优化开销，是一种易于实现且适合通用代码迭代编译的大程序优化方法.

参考文献 | 相关文章 | 计量指标

Select

基于非对称交叉开关的高阶路由器设计

方明1, 陈松乔1, 王克非2

2013,47 (01): 138-143.

摘要 ( 2690 )

对非对称交叉开关的吞吐率进行了理论分析和模拟测试，得出非对称交叉开关中排头兵效应的影响非常弱，几乎可以忽略.在此基础上，提出了一种基于非对称交叉开关的高阶路由器交换结构，即层次式非对称交叉开关结构设计方法，同时，给出了该交换结构的瓦片化微结构.结果表明，该结构可以获得很高的吞吐率.

参考文献 | 相关文章 | 计量指标

Select

一种基于编码分配的报片交换无缓冲路由器

沈剑良, 齐树波, 李晋文, 刘磊, 李思昆

2013,47 (01): 144-148.

摘要 ( 2128 )

提出了一种基于编码分配的报片交换无缓冲路由器（FBEA-BLESS），通过非偏转和偏转2级分配策略来减小路由器的关键路径延时，并采用go-stop-steer (GOSS)机制来避免网络的活锁.结果表明，与基准的无缓冲路由器(BLESS)相比，所提出的FBEABLESS的网络平均延迟降低了29.4%.

参考文献 | 相关文章 | 计量指标

Select

基于周期特性的双岛单电子晶体管主方程模拟及改进

隋兵才, 高军, 陈小保, 张超, 方粮

2013,47 (01): 149-154.

摘要 ( 2457 )

以双岛单电子晶体管（SET）为研究对象，采用稳态图和蒙特卡洛法分析双岛SET的周期特性，选取其中的7个典型状态，提出了双岛SET的简化主方程模拟方法，并利用分析所得SET的周期特性而改善简化主方程模拟方法的局限性.结果表明，所提出的模拟方法能够有效模拟双岛SET的电流和电压特性，并能扩展到多岛单电子晶体管.

参考文献 | 相关文章 | 计量指标

Select

网络舆论演化的高影响力优先有限信任模型

陈桂茸1, 2, 蔡皖东1, 徐会杰1, 晏沛湘3, 王剑平1

2013,47 (01): 155-160.

摘要 ( 3347 )

针对经典有限信任模型在观点更新时需考虑其他全部个体的观点，以及虚拟社会网络规模巨大、用户时间和精力有限等问题，提出了基于影响力和信任阈值、含有双重选择机制的网络舆论演化模型，并对参与网络舆论演化个体的观点坚持策略进行建模，在多个参数集下对该模型与经典有限信任模型进行仿真.结果表明，所获得结果与实际网络舆论演化的情况相符.

参考文献 | 相关文章 | 计量指标

Select

三态内容寻址存储器与多核网络处理器结合的IP查找加速模型

石巍, 卢泽新, 孙志刚

2013,47 (01): 161-166.

摘要 ( 2603 )

提出了一种三态内容寻址存储器(TCAM)与多核网络处理器(NP)相结合的IP报文路由查表加速模型.将前缀长度大于24的表项存放在硬件TCAM中；将前缀长度小于等于24的转发表项组织成压缩的二叉树形式，依据该数据结构截取其中部分表项并存放在硬件中，将其他部分存放在NP的2级缓存中，并将该部分的内存地址索引存放在TCAM中以加速查找；在静态随机存储器中存放转发信息，以最大限度地减小NP报文查表所需访存时延.结果表明：所提出的报文处理模型的可扩展性强，当路由表规模扩大时，其存储资源开销几乎不增加；而利用NP的多线程特性，其报文转发的理论吞吐量可达100 Gb/s的级别，能够满足现有核心路由器的转发需求.

参考文献 | 相关文章 | 计量指标

当期目录