AMD加速处理器

AMD APU
AMD A6-3650 (AD3650WNZ43GX)-top oblique-ar 5to4 PNr°0357.jpg

AMD A6-3650 APU
生产时间 2011年至今
销售 超微半导体
设计 超微半导体
制造商
处理器速度 1.0GHz至 4.4GHz
HT总线速率 至 6.4GT/s
制作工艺 0.032或0.040 至 0.028
指令集 CISC(x86-64)、RISCARMv7,仅限于Kaveri架构的TrustZone IP)
微架构 10h/12h
Piledriver
Steamroller
产品代号 10h/12h
Llano
Bobcat
Ontario
Zacate
Piledriver
Trinity
Richland
Jagaur
Kabini
Temash
Steamroller
Kaveri
核心数量 1至4个(Bulldozer/Piledriver架构的为1至2个模块)
一级缓存 64KB指令+64KB数据
二级缓存 1至4MB
插座

加速处理器英语Accelerated Processing Unit,缩写APU)是AMD一个处理器品牌,包括E1/E2/A4/A6/A8/A10六个子系列。[1][2][3][4][5]

APU以往以Fusion作为其项目代号。

历史[编辑]

超微(AMD)在并购ATI以后,随即公布了代号为“AMD Fusion”(融聚计划)。简要地说,这个项目的目标是在一块芯片上,集成传统中央处理器和图形处理器,并且内置最少16通道、可与外部PCI-E设备链接的PCI-E控制器,存储器控制器等。而这种设计会将北桥芯片从主板上移除,集成到中央处理器中,CPU核心还可以将原来依赖CPU核心处理的任务(如浮点运算)交给为运算进行过优化的GPU处理(如处理浮点数运算)。AMD认为这是加速处理单元(APU)的一类,[6]是为AMD加速处理器(AMD Accelerated Processing Units,AMD APU)。

首款市售的AMD APU在2011年1月4日于拉斯维加斯举行的消费电子展CES-2011)上发布,核心代号“Llano”。[7]2010年超微的财政分析日公布了2012年第二代Fusion APU的存在,核心代号为“Trinity”,[8]2011年5月底超微公布了更多关于2012年Fusion APU的产品线,[9]2012年5月“Trinity”正式发布,首发的是移动型号,CPU核心基于AMD Piledriver架构,GPU核心基于Radeon HD 7000系列(实际为Radeon HD 6900系列的4-VLIW SIMD设计),采用新的Socket FM2插座和A85芯片组。[10][11][12]

除了硬件规格的提升,超微也发布了多个AMD Catalyst驱动程序更新,用于提升内置的Radeon HD显示核心的性能表现。[13][14][15][16]

2013年,超微取消了基于Bobcat 2.0架构的Fusion APU,[17]取而代之的是Jaguar架构,核心代号分别为“Kabini”和“Temash”,对应超低功耗设备和平板设备,芯片采用台积电的28纳米制程制造。[18][19]

商标争议[编辑]

开始“AMD Fusion”只是超微的项目代号,后来成为超微的一个商标,然而这样却引起了争议。欧盟商标持有者的 Boost Up国际有限公司和Arctic Switzerland AG称它们早在2006年首先使用了“Fusion”作为它们一系列电源供应器的产品商标。[20]为避免争议进一步发展成商业诉讼,超微在2012年初期,计划将放弃“Fusion”商标,而倾向于改用“HSA”(Heterogeneous System Architecture,异构系统架构)作为AMD加速处理器的新商标,[21]然而,由于AMD和Arctic公司双方在谈判中无法就法律费用和许可费用达成妥协,最终还是失败了。

在2013年1月23日,Arctic宣布和AMD达成最终私人协议。[22]为消除争议,在2013年1月31日前,超微产品的制造商(包括搭载AMD处理器的品牌电脑和笔电、以及OEM制品)和代理商被要求立即终止“Fusion”和“AMD Fusion”商标的使用。[23]

大略技术特性[编辑]

与传统的x86中央处理器相比,超微着重强调AMD APU的“异构系统架构”(Heterogeneous System Architecture,HSA),即单片机上两个不同的架构进行协同运作,然而超微认为这个体系结构仍未成熟,但是未来将会使它变得更易于编程、更易于进行性能优化、负载资源更易于平衡、更高的性能以及更低的能耗。[24]2006年10月25日,AMD完成对ATi的收购后,公司就公布了“Fusion”项目,初期预计在2009年底或2010年初发布。它亦是Torrenza统一加速计算平台的一部分,配合FireStream流处理器进行协同运算。内置显示核心性能较一般的入门级独立显示核心和以往的集成显示核心强劲,能支持实时光线跟踪运算。

以往集成图形核心一般是内置于主板的北桥中。而AMD Fusion项目则是结合现时的处理器和绘图核心,即是将处理一般事务的CPU核心、处理3D几何任务以及图形核心之扩展功能的现代GPU核心、以及主板的北桥融合到一块芯片上。[25]目前的阶段里,AMD Fusion的硅芯片上有两个独立的核心,一个负责处理器,另一个负责绘图核心,两个核心并不是融合在一起,处理器有自己独立的缓冲存储器,绘图核心部分同样如此。两个核心会通过CrossBar互相连接。此外,Fusion亦会集成存储器控制器,后期与PCI-E控制器、HT总线控制器集成到一起并称为“统一北桥”(Unified Northbridge)。Fusion APU中的各个组件之间使用HyperTransport连接,使各个组件连接成一个整体。这种设计允许一些应用程序或其相关链接界面来调用图形处理器来加速处理进程,例如OpenCL。[26]处理器和绘图核心共用存储器控制器,可以直接访问存储器,但绘图核心没有独立的显示存储器,需要占用系统存储器的部分容量来充当之。南桥暂不会集成在Fusion APU芯片中,除了低功耗的、要求高集成度的SoC制品以外。未来AMD将会在AMD APU上实现存储器统一寻址空间,使CPU和GPU进一步结合。最终的目标是要将图形处理器和中央处理器“深度集成”/“完全融合”,可根据任务类自动分配运算任务予不同的运算单元中。[27]无论是当前还是未来,如此的设计可有效降低一般PC平台的功耗和发热量,尤其是对功耗发热敏感的HTPC和笔电来说更具吸引力。

采用AMD C系列APU的Acer Aspire522上网本

纵使处理器和绘图核心二合为一,但AMD会继续设计中阶以上级别的独立显示核心,因为高端用户和物理计算仍然依赖独立显示卡的强大运算性能。

无论是桌面型平台还是移动平台,部份AMD的中阶和中低级的独立显示核心可与处理器的内置显示核心进行“交火”互联,对于中高级以及高级的独立显示核心由于和内置显示核心交火互联的性能提升效果不明显而没有支持。此技术亦可配合增强的AMD PowerNow!电源管理技术,使笔记本电脑更节省电量。例如一部笔记本电脑同时配置了Fusion APU处理器和AMD的独立显卡。当移动使用时,独立显示核心会被关闭,只使用Fusion APU处理器内的显示核心,以节省电量。当接驳了外置式电源时,可以根据图形处理负载,决定内置显示核心和独立显示卡的开与关,较低的图形数据负载时也只打开内置显示核心,而在较重的图形数据处理时,独立显示核心打开或两个显示核心协同运作,以提供更强大的显示性能。类似的设计也延伸到搭载非AMD处理器的笔电上,功效也和搭载AMD APU的一样,在内置显示核心和独立显示核心之间根据负载进行切换,但无法使用交火功能使两个显示核心协同运作。

目前AMD APU中已内置的模块单元[编辑]

片上系统SoC)模块单元 集成到性能级APU的年份 集成到低/超低功耗APU的年份 被取代的片上系统模块单元 备注
AMD K10处理器核心 2011年
AMD Bobcat处理器核心 2011年
AMD Radeon HD 6000显示核心 2011年 2011年 是为5-VLIW SIMD架构
北桥[24][28] 2011年 2011年
PCIe控制器[24][28] 2011年 2011年
DDR3存储器控制器[24][28] 2011年 2011年 仲裁存储器一致性和非一致性请求。[29] 系统主存被划分为图形核心使用的显示专用存储器(最多2GB容量)和CPU核心使用主存。[29]
UVD单元[24][28] 2011年 2011年
显示控制器 2011年 2011年
AMD Piledriver处理器核心 2012年 AMD K10处理器核心
AMD Radeon HD 6900显示核心 2012年 AMD Radeon HD 6000 4-VLIW SIMD架构而非Radeon HD 7000系列的GCN架构,但品牌命名上属于AMD Radeon HD 7000[30]
AMD 高分辨率媒体加速器(AMD HD Media Accelerator)[31] 2012年 UVD单元 相比旧有的UVD单元,新的媒体加速器包括AMD 高分辨率完美画面技术(AMD Perfect Picture HD)、AMD Quick Stream技术(类似对手英特尔的Quick Sync Video技术),以及AMD Steady Video技术[31]
HDMI, DisplayPort 1.2,DVI控制器 2012年
统一北桥 2012年 北桥 新的统一北桥与旧有的集成北桥相比,内置处理器电源管理和新的C6电源状态,新增Turbo Core 3.0(可根据负载需要和功耗状态动态调整CPU核心和GPU核心的电压和时钟频率,允许一段时间内实际时钟频率和电压高于默认值但不超过热设计功耗)[32]
AMD Jaguar处理器核心 2013年 AMD Bobcat处理器核心
AMD Steamroller处理器核心 2013年 AMD Piledriver
AMD Radeon HD 7000显示核心 2013年 2013年 AMD Radeon HD 6900系列显示核心 新的GCN(Graphics Core Next)显示核心架构:RISC SIMD取代4/5-VLIW SIMD
南桥 2013年
ARM Cortex-A5 MP-Core 2013年 ARM授权AMD作为TrustZone IP使用
AMD Radeon HD 8000显示核心 AMD Radeon HD 7000显示核心
AMD Excavator处理器核心[33] AMD Steamroller处理器核心

AMD异构系统结构发展时程[编辑]

类型 HSA特性 首次实现时间 备注
优化平台 图形处理器运算支持C++语言 2012年
“Trinity” APU
支持OpenCL C++指令和微软公司即将公布的C++ AMP语言。这样做可以更容易为CPU和GPU进行程序编写,使它们两者更好地协同运作,来处理并发运算负载。
HSA MMU GPU可以通过HSA MMU的转译服务和标签页故障管理来访问主系统存储器。
统一电源管理 GPU和CPU的供电由单一电源管理单元统一管理,可根据当前系统负载需要来决定各个单元的电源供应,以提高运算单元的复用率和能耗比。
架构集成 统一虚拟寻址空间[24][28] 2013年
“Kaveri” APU
GPU 能直接使用 CPU 的虚拟寻址访问系统存储器,并允许 CPU 与 GPU 之间指针为指针 (pointer-is-a-pointer)。统一寻址空间将让异构运算程序的编程难度大大减少,并允许 CPU 与 GPU 之间更多高级的存储器共享运用。
一致性系统存储器 GPU 运算单元能直接以统一虚拟寻址空间的指针,访问位于一致性区城的系统存储器,同时亦窥探 CPU 的缓存,实现 GPU 与 CPU 的缓存一致性。
GPU 访问标签页式系统存储器 借由统一虚拟寻址空间及 HSA MMU,GPU 亦能访问可标签页的系统存储器统标签页存储器(即虚拟内存)。目前的 GPU 要访问可标签页存储器,必须先行复制副本,或是钉选标签页 (pinning)。
系统集成 GPU 运算上下文切换 2014年 进行中的 GPU 与运算任务可以进行上下文切换,因而在多任务环境下系统能更快速地处理应用程序、运算任务以及图形处理,为用户提供无缝的性能体验。
GPU 图形处理优先权 在可以进行上下文切换的同时,图形处理将会被给予更高的优先权,以使图形处理的延时未免受多任务处理影响。长时间运行的图形处理任务将会被中断并暂时切换。
服务质量控制(QoS)[24] 除了多任务切换以及优先权控制以外,硬件资源可以在多用户和应用程序之间平衡分配或进行优先权调度。

类似设计[编辑]

超微的竞争对手英特尔英伟达也有类似的设计。

  • 英特尔最早在超微宣布“Fusion”项目不久后也宣布其处理器未来将集成图形核心,其首发产品是2009年底基于Intel Westmere架构的Core i5Core i3,它们是将包含图形处理器的北桥以及CPU核心两个独立的芯片一同封装在同一处理器基板[34],而后来的Sandy Bridge以后除极致性能和部份企业级产品以外均采用类似AMD Fusion的设计:三级缓存也是CPU核心和内置GPU核心共用;显示核心也支持OpenCL以使得可以和CPU核心进行协同运算,尽管性能上仍然受制于英特尔当前还比较孱弱的图形核心处理能力,而且许多异构运算的特性仍然缺乏支持;CPU核心新增的AVX(高级矢量扩充)等新指令集也加强了其内部各单元的并发处理能力。

然而NVIDIA片上系统产品“Tegra”虽然也是显示核心和ARM CPU核心集成到一块芯片上,但GPU并不会协助CPU核心处理运算任务,仍然只负责图形处理,和当下其它移动设备的系统芯片一般。而NVIDIA也表明,“Project Denver”和“Tegra”的目标本身就有很大的不同,在当下两者之间完全无关系。丹佛计划的目标是使图形处理器作为和当下的中央处理器一般的通用处理器使用,以性能为主要导向;而“Tegra”面向移动设备SoC,再者,省电是其设计主要导向之一。[36]

客制化APU[编辑]

2013年5月1日,AMD公布将会提供半客制化APU服务。[37] 这些APU专为各间公司的不同要求而定制,种类包括一般的消费级APU到特定用途APU。其中最广为人知的例子就是PS4Xbox One所采用的客制化APU。[38]

处理器列表[编辑]

第一代桌面型APU于2011年秋季推出,采用Socket FM1,包括A4、A6和A8。

第二代桌面型APU于2012年推出,采用Socket FM2,包括A4、A6、A8和A10。

第三代桌面型APU于2013年推出,采用Socket FM2,包括A4到A10。

第四代桌面型APU于2014年推出,采用Socket FM2+,包括A4到A10[39]

第五代桌面型APU将于2015年上半年推出,采用Socket FM2+,包括A4到A10

媒体谈论[编辑]

参考资料[编辑]

  1. ^ 采用AMD加速处理器的主流台式电脑. 超威半导体. 超威半导体. [2013-06-23].
  2. ^ 采用AMD加速处理器的笔记本. 超微半导体. 超微半导体. [2013-06-23].
  3. ^ 采用 AMD 加速处理器的平板电脑. 超微半导体. 超微半导体. [2013-06-23].
  4. ^ AMD A系列一体化处理器(APU)——“一个顶俩 ”. 超微半导体. 超微半导体. [2013-06-23].
  5. ^ AMD Accelerated Processing Units – amd.com
  6. ^ Stokes, Jon. AMD reveals Fusion CPU+GPU, to challege Intel in laptops. Ars Technica. February 8, 2010 [February 9, 2010]. (原始内容存档于10 February 2010).
  7. ^ AMD Fusion APU Era Begins
  8. ^ AMD begins shipping Brazos, announces Bulldozer-based APUs, [1] pdf
  9. ^ AMD’nin 2012 için planladığı yeni nesil Fusion platformları detaylandı. Donanimhaber.com. [2012-08-22].
  10. ^ Building an AMD ‘Trinity’ desktop PC | ZDNet
  11. ^ AMD Trinity Desktop APU Specs Revealed. Cpu-world.com. [2012-08-22].
  12. ^ AMD reveals its 2012-2013 roadmap, promises 28nm chips across the board by 2013. Engadget. 2012-02-02 [2012-08-22].
  13. ^ AMD Catalyst 12.11 Driver Performance Never Settle.
  14. ^ AMD Catalyst.
  15. ^ AMD Catalyst.
  16. ^ AMD Catalyst.
  17. ^ Hruska, Joel. Manufacturing bombshell: AMD cancels 28nm APUs, starts from scratch at TSMC.
  18. ^ AMD APU 2013路线图:全线新架构、新工艺 – mydrivers.com
  19. ^ AMD低功耗APU性能曝光 – ithome.com
  20. ^ “AMD targeted by Arctic over Fusion bran”, bit-tech, 23 January 2012. Retrieved 28 January 2013
  21. ^ “AMD ditches Fusion branding”, bit-tech, 19 January 2012. Retrieved 28 January 2013
  22. ^ “ARCTIC and Boost Up Announce Negotiated Solution with AMD Regarding “FUSION” Trademark in European Union”, http://www.arctic.ac, 23 January 2013. Retrieved 28 January 2013
  23. ^ “Use of the terms “AMD” and “AMD Fusion””, 18 December 2012. Retrieved 28 January 2013.
  24. ^ 24.0 24.1 24.2 24.3 24.4 24.5 24.6 THE PROGRAMMER’S GUIDE TO THE APU GALAXY.
  25. ^ ATI chipsets already include GPU
  26. ^ phx.corporate-ir.net/External.File?item=UGFyZW50SUQ9ODUyOTR8Q2hpbGRJRD0tMXxUeXBlPTM=&t=1|APU101_Final_Jan 2011.pdf
  27. ^ AnandTech – AMD Outlines HSA Roadmap: Unified Memory for CPU/GPU in 2013, HSA GPUs in 2014
  28. ^ 28.0 28.1 28.2 28.3 28.4 AMD Outlines HSA Roadmap: Unified Memory for CPU/GPU in 2013, HSA GPUs in 2014.
  29. ^ 29.0 29.1 AMD Fusion Architecture and Llano.
  30. ^ 根据AMD的说法,它们计划每年都会发布新的AMD APU,新的A10 APU系列将面向比A8更高性能级别的电脑,新的A8 APU将面向以往A6 APU的主流市场。见:as portrayed in this APU roadmap document。2012年AMD发布了新一代AMD APU的旗舰型号A10-5800K,核心代号“Trinity”,CPU核心的性能比上一代AMD APU的旗舰型号A8-3870K高出20%~30%,而GPU核心的性能则有30%~50%的性能增长,其中GPU核心从原来基于AMD Radeon HD 5000/6000系列显示核心的5-VLIW SIMD架构升级到效率更高和性能更强的AMD Radeon HD 6900系列(核心代号“Cayman”)显示核心的4-VLIW SIMD架构,并且将制程从40纳米提升到32纳米,见:this article.
  31. ^ 31.0 31.1 AMD’s 2nd Generation APU, Codenamed “Trinity,” Will Enable Superior Multimedia Experience for Our “Connected” Generation. (原始内容存档于2013-04-07).
  32. ^ CPU + GPU = APU: East Meets West.
  33. ^ The Bulldozer Review: AMD FX-8150 Tested, AnandTech, 2011-10-12 [2012-01-23]
  34. ^ 集显U会限制超频么?酷睿i3-530超频实测 – zol.com.cn
  35. ^ CES 2011:NVIDIA 发表桌电用 ARM CPU 计划“Project Denver” – engaget.com
  36. ^ 深度解析NVIDIA的三极化战略:Denver和Tegra没关系? – mydrivers.com
  37. ^ AMD Establishes Semi-Custom Business Unit to Create Tailored Products with Customer-Specific IP – X-bit labs
  38. ^ Three for three: How AMD won the war for the heart of next-gen consoles
  39. ^ http://www.inpai.com.cn/doc/hard/203603.htm

外部链接[编辑]

Advertisements

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

You are commenting using your WordPress.com account. Log Out /  更改 )

Google+ photo

You are commenting using your Google+ account. Log Out /  更改 )

Twitter picture

You are commenting using your Twitter account. Log Out /  更改 )

Facebook photo

You are commenting using your Facebook account. Log Out /  更改 )

Connecting to %s