异构计算当道 APU异构百核实战解析
异构计算在PC行业里得到了更多关注,主要原因来自于AMD发布的AMD Fusion系列APU,通过CPU与GPU的完美融合,APU的一个重大特点就是支持“异构计算”, 首次让用户感受到了传统PC在性能与应用上的巨大提升。AMD为“异构计算”这个特色功能起了个通俗名称——“百核加速”;意思是可以利用APU内置的数百个GPU处理核心和CPU的四个核心进行协同加速计算,从而达到性能大幅提升的目的。
异构计算受关注还有一个重要因素是原来的CPU+GPU平台组合由于没有合理利用而存在一些功率浪费:通过提升CPU时钟频率和内核数量而提高计算能力的传统方式遇到了散热和能耗的瓶颈;与此同时,GPU等专用计算单元虽然工作频率较低,具有更多的内核数和并行计算能力,总体性能-芯片面积比和性能-功耗比都很高,却远远没有得到充分利用。因此,人们希望找寻到一种更加高效工作的技术,异构计算也就孕育而生。
异构计算主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU等处理器,也包括、DSP、ASIC、FPGA等。广义上,不同计算平台的各个层次上都存在异构现象,除硬件层的指令集、互联方式、内存层次之外,软件层中应用二进制接口、API、语言特性底层实现等的不同,对于上层应用和服务而言,也都是异构的。回到我们今天讨论的话题,正因为由上述这些特点,异构计算所蕴含着巨大的优点,对于融合芯片而言,异构计算帮助芯片内部的各个组件提高对话效率,帮助基于此芯片构建的系统实现性能提升。在此评测文章中我们非常期待来自AMD APU A6-3400M的异构计算性能表现。 以下是我们选取的两款平台配置:
硬件测试环境 | ||
品牌 | AMD(支持DX11) | INTEL |
处理器 | A6-3400M 1.4GHz/2.3GHz | i5-2410M 2.30GHz/2.90GHz |
内存 | 4GB DDR3 1333MHz | |
显卡 | AMD Radeon HD(6520G+6650M) | Intel Graphics HD3000 NVIDIA Geforce GT540M |
硬盘 | 5400rpm S-ATA HDD | |
显示器 | 14英寸LED宽屏 1366x768分辨率 | |
系统 | Windows 7 Ultimate 64bit |
HC Benchmark测试APU异构系统综合性能
由中国计量科学院近期开发完成的HC Benchmark,是全球第一款真正的异构计算基准测试工具,能够真正同时调用CPU、GPU资源。这个工具的测试有办公应用、视频体验、上网体验、游戏体验四部分,可自由选择进行测试,完成后给出四个子分数和一个总分数。如果系统中有APU这种异构系统,程序就会自动为CPU、GPU分配计算任务。如果说GPU不支持加速计算,就会全部交给CPU执行。 换句话说,HC Benchmark最终的得分,取决于异构芯片内部的CPU和GPU计算任务分配是否合理、芯片内建的GPU是否支持加速计算。
HC Benchmark测试结果所体现出的正是AMD APU独有的异构系统优越性。从这两个不同平台的对比结果看,正是由于Intel不支持异构计算,没有办法判断或者不能合理分配处理任务,导致CPU与GPU在协同工作的效能大打折扣,从而降低整机综合处理能力,同时在运行繁重任务时增加整机功耗与散热,而这两处缺点却正好是AMD APU这次革新所带来的巨大优势。
IE9测试APU硬件加速性能
为提高性能,Internet Explorer9使用计算机的图形处理器来处理侧重图形的任务,比如视频流或在线游戏内容。通过利用GPU,Internet Explorer9提供了更快更逼真的Web体验及前所未有的交互性。这一切完美性能的表现均来自于AMD APU所支持的硬件加速技术,在说到硬件加速技术之前,我们不得不提到Open CL,事实上也正是对Open CL的支持,给予了AMD APU这种卓越性能。
首先作为一个专为异构平台编写程序的框架,Open CL能够调用系统内的全部计算资源(CPU与GPU),在将电脑中的一个或多个运行程序按运算量,平衡分配给系统中的各个运算部分。也就是说用户在使用基于OpenCL标准编写的程序时,再也不会出现处理器占用率100%,显卡占用率几乎没有的现象了。同样也是基于此基础,AMD APU的硬件加速技术在用户有需要使用CPU来完成的工作时(如转换视频),GPU就会帮助CPU进行运算,以提高转换速度。
IE9鱼缸测试成绩,在300条鱼的条件下,APU平台取得30帧/秒的成绩,而相应i5平台只有22帧,APU完全领先。
暴风影音•锐加速版测试动态视频美化
AMD APU还为暴风影音•锐加速版带来了一项令人新奇的功能——动态视频美化。这项功能技术借助APU的异构计算性能,可对视频进行全局画质增强、拆分画质增强以及对比画质增强。通过使用该功能,暴风影音•锐加速版播放器的用户可对视频播放进行一键优化,将视频画面处理得更加清晰、平滑、炫丽,同时保证更为流畅的播放速度。暴风影音•锐加速版对于普通用户来说可能相对比较抽象,但对于一些摄影玩家来说却会很有用。
动态视频美化的原理很容易明白,其大概意思是:基于APU的异构计算特性,采用特殊算法对播放中的视频进行像素补偿;与此同时,APU内建的GPU会基于特有的细节强化技术,将画面轮廓勾勒得更清晰,并对图像的非合理性信息做出修正、对每帧图像进行合理的自适应性增强,增强图像的空间与真实感。就实际的演示而言,这个功能带来的出色效果的确令人印象深刻。
可以看到上图左右两个半屏的显示效果有着明显的差距,屏幕一分为二,左半边是源视频,右半边是开启“动态视频美化”后的效果,在帧率补偿过后,画面不仅更加稳定,色彩也明晰亮丽了许多,视觉体验有了很大提升。
总结
不可否认采用异构计算的AMD APU在应用层面上带来的革新是巨大的,但就目前来讲,用以支持其异构计算运行的软件规模还处于发展中,大面积的应用还需等待一段时间。然而但在普通用户层面上,目前常见的应用却是对于异构计算的支持却没有任何问题,常用的暴风影音、IE浏览器、Photoshop、ArcSoft TMT等均支持AMD APU系列处理器的异构计算与百核加速性能。从上文的评测中,我们也可以非常直接的感受到这一全新理念所带来的全新用户体验。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
本文地址:/bijiben/2021-03-11/34632.html