推土机微架构

推土机微架构[1][2][3](英语:AMD Bulldozer)是AMDK10微架构之后推出的中央处理器微架构[2],由 IBM Power4 的总工程师 Chuck Moore 操刀。该微架构主要应用于桌面型平台伺服器平台乃至超级电脑的微处理器核心上。Bulldozer在历经数次跳票后于2011年9月19日发布,其首发产品是核心代号为“Zambezi”的AMD FX

推土机微架构
产品化2011年至2014年
推出公司超微半导体(AMD
设计团队超微半导体(AMD)
生产商
微架构CISC(x86-64)
指令集架构AMD64/x86-64x86MMX3DNow!SSE(1、233S4a4.14.25(后拆分为XOPFMA4CVT16)、AVXAESNX bitAMD-V
制作工艺/制程32纳米
核心数量3至16(1.5模块至 8模块)
一级缓存每整数调度单元16KB指令
每模块共享32KB指令
每模块64KB资料
二级缓存每模块2MB 16路
三级缓存全部模块共享8MB 16路
CPU主频范围1.600 GHz 至 4.200 GHz
HyperTransport速率至 6.4 GT/s
CPU插座
封装
应用平台伺服器工作站台式电脑超级电脑
核心代号
  • 伺服器:
    Interlagos
    Valencia
    Zurich
  • 桌面型:
    Zambezi
使用的处理器型号
上代产品AMD 10h处理器家族
继任产品AMD Piledriver

Bulldozer微架构从一个早期已搁置的微架构设计发展而来[3],主攻热设计功耗为10瓦至125瓦的处理器平台。AMD预期认为,基于Bulldozer架构的处理器在实际应用中每个“推土机”(Bulldozer)核心每瓦性能可达到高性能计算(High-performance computing,HPC)的水准。届时每个“推土机”核心会支持Intel绝大部分的指令集(包括SSE4.1、SSE4.2、AESCLMUL以及AVX),以及AMD自有的指令集(包括由SSE5拆分而来的XOPFMA4CVT16[4][5]

概观

2011年,AMD处理器开始导入32纳米制程,推出APU(加速处理单元)新形态处理器,应用在台式电脑手提电脑。超微的处理器架构有两大关键的调整方向,依用途区分成两种系列,其研发技术代号分别为Bulldozer与Bobcat。Bulldozer架构针对主流伺服器、台式电脑、手提电脑的应用,提供高存取性能与高负载多线程的架构,并选择以APU配置的高延展性来链接图形处理器;Bobcat主攻低耗电的超轻薄电脑应用。[6]

Bulldozer架构的处理器均使用格罗方德的32纳米HKMG SOI制程,重新使用类似DEC的多任务计算的设计。根据AMD的发布说明,“平衡专用和共享的处理器运算资源,来提供一个易于成倍提升计算性能的,高度紧凑的单片机多核心的设计”。[7]换句话说,透过精简处理器核心一些“冗余”部分,辅以多核心/多线程的设计,超微希望籍此以更少的能耗,来充分发挥这些核心的特性和性能来提升整块微处理器乃至整个平台的性能。AMD研究员Tim Fischer表示,Bulldozer采用全新的控制结构和运算单元,其性能体现于整数运算、浮点运算、L1缓存、电源管理,和时脉产生器等……均是开发重点,主要意义在于降低功耗并提升单位功耗的性能。[8]

Bulldozer微架构的设计早在2003年已出现,由于AMD忙于K8微架构处理器的研发和推出而搁置,后来Bulldozer架构在该微架构的基础上重新设计。可合并为1个256位的2个128位并且可进行融合乘法运算的浮点运算单元,这个主要特性在2003年的设计中已出现;一个Bulldozer核心单元中,除了前述的浮点运算单元外,还拥有两个整数调度运算单元,每个整数调度运算单元各自拥有4条流水线(另外的读取、解码这两级流水线为两个整数运算单元所共享);L1缓存为每整数调度运算单元独占,但L2缓存则为两个整数调度运算单元所共享。AMD称这样的一个单元为一个“模块”,一个16线程的Bulldozer处理器中包含8个这样的模块,但一个模块并不会被辨认为一个物理核心,而是根据一个模块中的2个整数调度运算单元的数量辨认为两个逻辑核心(即操作系统会将1个模块辨认为两个逻辑核心/线程)。[9]一个“模块”包含2个逻辑核心,和Intel超线程技术中1个物理核心被辨认为2个逻辑核心的做法似乎有类似之处,但事实上,两者大相径庭:AMD Bulldozer的“模块”为每条线程提供了各自的整数运算调度单元和一级指令缓存,而英特尔的超线程则是两条线程共享核心内所有可用的运算资源。[10]

基于Bulldozer微架构,32纳米SOI HKMG制程的处理器产品于2011年9月率先于桌面型平台上发布,是为核心代号“Zambezi”(Socket AM3+,4至8线程)之AMD FX系列;紧接着的是10月12日发布伺服器平台,核心代号“Interlagos”(Socket G34,16线程)、“Valencia”(Socket C32,4至8线程)之AMD Opteron系列[11][12]重新激活了AMD少有的“FX”品牌。首发的桌面级产品FX-8150,将有四个Bulldozer模块;伺服器级微处理器,代号Interlagos,是由两个包含4个Bulldozer模块的MCM、共八个Bulldozer模块所构成。[13]

微架构特性

Bulldozer核心/模块

 
完整的Bulldozer模块之示意图
 
完整的基于Bulldozer微架构的处理器示意图,包含:4模块8核心8线程、L3缓存以及I/O总线
 
Bulldozer伺服器的存储器架构
  • AMD认为并对外声明这种模块化的设计是“基于集群的多线程”或“两个整数调度运算单元的集群”。这种基于集群的多线程技术一般称为“集群多线程”(CMT,Clustered Multithreading),而AMD则定义:基于这种设计的处理单元为一个“模块”(Module)。从硬件的复杂性和功能性的角度出发,Bulldozer模块(集群多线程)介于两个独立的处理器核心和超线程之间。两个独立的处理器核心的设计中,每个核心拥有独立的处理单元、缓存等运算资源,一般称这种多线程设计为晶片级多核心CMP,Chip Multi-Processor);而超线程则是两条线程运作于一个运算调度资源足够多、流水线足够长(但不可太长)的处理器核心上,两条线程的运算资源是共享的,包括处理单元、缓存,一般称这种多线程设计为同步多线程SMT,Simultaneous Multithreading);而集群多线程中一般几条线程或多或少共享fetch、寄存器甚至是浮点运算单元等运算资源,但主要执行单元——整数调度运算单元都是独占的[14]。这种集群式多线程微架构的设计,综合了晶片级多核心和同步多线程的特点,最早的实例是DEC在1996年研发后来推出市场的精简指令集体系的微处理器Alpha 21264,后来的Sun微系统公司甲骨文公司开发的UltraSPARC T1(核心代号“Niagara”)、UltraSPARC T2(核心代号“Niagara 2”)微处理器也是采用类似的设计(UltraSPARC T2还同时使用了同步多线程技术[14])。[15][16]
    • 超微采用集群多线程设计的Bulldozer模块中,包含两个x86整数运算调度单元并被辨认为两个逻辑核心,每个整数运算调度单元各自占有16KB一级指令缓存;一个可拆分为两个128位元的256位元浮点运算单元,fetch、解码器、二级缓存I/O总线等为两条线程所共享,即一个模块所有。
  • 每模块都拥有独立的硬件资源:[17][18][10]
    • 2MB的L2缓存(模块内两个整数运算调度单元共享);
    • 模块内两个整数运算调度单元共享2路32KB一级指令缓存,每整数运算调度单元独占1路16KB一级指令缓存和全数4路64KB一级资料缓存,包含缓存分支预测[19][20][21]
    • 两个独立的整数运算调度单元/整数核心,
      • 每个整数运算调度单元拥有两个算术逻辑单元ALU,Arithmetic logic unit)和地址产生单元AGU,Address generation unit),由此一个整数调度运算单元在一个时钟周期内可完成4次运算操作和存储器存取作业,即一个模块可达成8指令发射/处理作业;
      • 对一些偏重多线程的应用程式,两个整数调度运算单元和更多的执行流水线可提供更多的硬件资源予两条并发的线程上,以提升这些应用程式的性能表现;
      • 两个整数运算调度单元的Bulldozer模块比仅有1个整数运算调度单元的仅多出12%的晶体管数量以及5%的晶片面积增量[22]
    • 一组两个对称的128位FMAC(融合乘法加法)浮点运算单元,在接收到有256位浮点运算作业的指令(如AVX)或并发的(x87/MMX/SSE等)128位浮点运算作业后可以合并为1个256位元的浮点运算单元,这种设计可以更好地兼容一些不支持并发对称浮点运算的应用程式;
    • 共同的Fetch/解码流水线;
  • 所有模块共享三级缓存和增强的双通道DDR3-SDRAM存储器控制器;
  • 一个模块共计2.13亿个晶体管,占用30.9平方毫米的晶片面积,这个数据包含了2MB的二级缓存,四个模块共计约12亿晶体管;[23]
  • 按照超微的说法,基于AMD Bulldozer微架构的处理器上,一个双线程的的处理器上有一个Bulldozer模块(2个整数调度运算单元),一个4线程的处理器有两个模块(4个整数调度运算单元),一个8线程的处理器上有4个Bulldozer模块(8个整数调度运算单元),如此类推。

指令集

  • 支持IntelAVX指令集(Advanced Vector Extensions,高级矢量扩展),使处理器支持256位元的浮点运算作业。除此之外还支持Intel授权的SSE4.1、SSE4.2、AESCLMUL、Multiply-Add/Accumulat等[8],以及AMD自有的XOP、FMA4、CVT16、SSE4a等,其中XOPFMA4CVT16是AMD原先的SSE5拆分而来(原本Bulldozer将会实现SSE5指令集,但是由于Intel选择不支持SSE5而另立自己的AVX指令集,AMD最终决定将SSE5分拆)[24],尽管这三者为并发对称的128位算指令,但可以兼容于AVX的编码方案。[25][26][25][27]

制程/制作工艺、时钟频率、热设计功耗

 
四模块八核心的AMD Bulldozer架构的处理器
  • 11层金属、32纳米SOI辅以格罗方德首代HKMG制程;
  • Turbo Core 2.0,和上代Turbo Core一样可以根据处理器的负载状态调整各处理器核心的时钟频率。在处理器核心闲置时可以降低其时钟频率乃至关闭核心;处理器核心满载时可以提升其时钟频率,处理器半数核心处于满负荷时可以有1GHz的提升幅度,全部核心满载时也有500MHz的提升幅度,但是时钟频率的提升会保持在处理器的TDP限制(俗称“热墙”或“工作温度墙”)之下。与上一代Turbo Core相比,Turbo Core 2.0可以使处理器核心关闭,而且可以调整各个核心的时钟频率,而首代Turbo Core则只能一次过调整半数核心的时钟频率而不能调整单个核心的,核心闲置也不能被完全关闭。[28]
  • 处理器核心电压在0.775V至1.425V,伺服器平台的默认时钟频率最低1.6GHz,最高3.4GHz;桌面型平台默认时钟频率最低2.8GHz,最高达4.2GHz;[23]
  • 热设计功耗最低25,最高140瓦。

缓存、存储器

  • 单片机最高8MB的路缓存容量,4模块8核心共享;伺服器版本最高端型号的AMD Opteron 6200系列4模块8核心以上的则为16MB(两个多晶片模块)。单片机的8MBL3缓存被划分为4个容量相同的2MB的部分,可以和北桥(存储器控制器)一并运作于2.2GHz的时钟频率上,于1.1125V的操作电压;[23]
  • 原生支持DDR3-1866存储器;[29]
  • 桌面型平台的处理器,内建双通道DDR3存储器控制器,支持PC3-14900(DDR3-1866)、PC3-16000(DDR3-2000)、PC3-17000(DDR3-2133)以及更高规格的存储器;伺服器/工作站平台的处理器,则内建四通道DDR3存储器控制器,可支持PC3-1280(DDR3-1600)暂存型存储器(ECC存储器,仅核心代号“Valencia”、“Interlagos”支持)。[30]
  • AMD称每通道支持两条DIMM DDR3-1600(亦即每通道的两条DIMM存储器插槽可插满DDR3-1600的存储器),但单个通道两条DIMM插上DDR3-1866存储器时会降低存储器时脉至1600MHz。

输出输入总线、配套晶片组、处理器插座

 
第一代Bulldozer的处理器之I/O界面示意图
  • HyperTransport总线升级为3.1版本,默认运作时钟频率3.20GHz,发送速率6.4GT/s,带宽25.6GB/s,单向位宽16位。新版本的HyperTransport,在上一代K10.5微架构,HY-D1步进的“Magny-Cours”核心(socket G34平台,新步进版本于2010年3月推出)和“Lisbon”核心(socket C32平台,新步进于2010年6月推出)AMD Opteron处理器上业已使用。
  • AMD官方接受媒体采访时确认:“现有的G34、C32伺服器平台会支持基于推土机的新款伺服器产品(核心代号为“Interlagos”/“Valencia”)。至于桌面上,为了充分发挥推土机架构的能力,会引入增强的AM3+接口,支持推土机并向下兼容现有AM3接口处理器。”[31][32]
    • 桌面版处理器使用的插座为Socket AM3+(也称AM3r2)配套晶片组为900系列晶片组[33][34]此代晶片组除了支持AMD自家的CrossFireX多卡互联技术以外,还会支持NVIDIA SLI多卡互联技术。[35]
      • 处理器上共942个针脚,插座上也有942个脚位,但和同样也是942个脚位的Socket AM3插座不同的是Socket AM3+仅支持DDR3-SDRAM存储器、HT总线版本不同以及供电稳定性更强;
      • 可向下兼容于800系列晶片组、使用Socket AM3插座(包括一些已使用Socket AM3+的)的主板,但需要主板厂商提供BIOS/EFI固件更新[36][37],因为AMD官方没有提供正式的技术支持,也没有说明Socket AM3+接口的处理器可使用于Socket AM3插座的主板,然而AMD却说明了Socket AM3接口的处理器可以使用于Socket AM3+插座的主板上。[38][31]
    • 伺服器/工作站平台则继续沿用既有的伺服器晶片组和既有的socket G34(LGA1974)和socket C32(LGA1207)。[31][32]

处理器

桌面型处理器

基于Bulldozer微架构的桌面型平台处理器为AMD FX,于2011年9月19日正式上市[39]。使用GlobalFoundries 32nm SOI工艺,支持Turbo Core 2.0、Cool'n'QuietHyperTransport 3.1等技术。使用新的Socket AM3+(942)插座,支持DDR3-1866双通道内存,分为8核、6核、4核三种版本,主频从2.8GHz~4.2GHz不等。配套晶片组为AMD 900系列晶片组。

Bulldozer与Fusion APU“Llano”两个系列处理器的上市时间定案,分别是2011年9月19日跟2012年第一季。[40]最初有4个Bulldozer处理器在2011年9月19日发布,分别是:四核心FX-4100、六核心FX-6100、八核心FX-8150、FX-8120。[41]三核心型号(1.5个模块,微软KB2592546补丁的定义为“1.5核心”)只供OEM市场。[42]

伺服器处理器

2011年11月14日,AMD宣布推出针对伺服器等级性能的Opteron 6200与4200系列处理器(先前代号分别为:Interlagos与Valencia),主要将提供其扩展性,并且提供高出73%的存储器带宽,以对应更高阶的虚拟化技术应用,同时在整体耗电量部分也让每组核心减少原有一半,同时也让主机使用空间减少三分之二,进而节省更多电力空间成本支出。[43][44]

AMD也同步透露2012年将加入全新AMD Opteron 3000伺服器平台,主要锁定超高密度、超低功耗的1路网络主机托管(Web Hosting)、网络伺服器(Web Serving),以及微型伺服器(Microserver)等应用领域。其中将会先推出代号为“Zurich”的4至8核心架构的处理器系列,同样采用推土机(Bulldozer)架构且对应AM3+插槽,并且预计将于2012上半年间出货。[43][44]

主要特性

  • 同价位伺服器处理器产品性能约较竞争品牌高出89%[43][44]
  • 处理器阵容齐全、从4核心一路涵盖到16核心[43][44]
  • 与前代平台相同的功耗曲线下,每颗核心功耗最低约可达4.375W[43][44]
  • 处理关键云端、虚拟化及高性能运算等作业时,性能可高出24%至84%[43][44]
  • 拥有2路处理器最高的TPCC速度测试分数[43][44]
  • 最低的虚拟系统(virtual machine,VM)单位成本[43][44]
  • 最高可达4个存储器通道,最高可支持1600MHz存储器时脉[43][44]
  • 支持1.25伏特超低电压存储器[43][44]
  • 每颗处理器最高支持12组DIMM存储器,最高可支持384GB存储器[43][44]
  • 最多可支持4个16倍速的HyperTransport(HT3)链路,每个链路传输速度达每秒6.4GT[43][44]

性能表现和市场反应

AMD FX系列性能问题

首款基于Bulldozer微架构的消费级处理器AMD FX上市后,在微架构的设计上、性能上和能耗上饱受争议。首发的顶级型号FX-8150,在倚重单线程的基准性能测试中,测试结果显示FX-8150不仅落后于基于NehalemSandy Bridge等微架构的Intel Core i系列,还不如基于K10微架构的AMD Phenom II系列;[45]不过在倚重多线程的性能测试中,结果显示勉强可以追平Phenom II X6 1100T和Intel Core i7-2600K。纵观各媒体的性能测试结果,FX-8150综合性能强于Intel Core i5 2500K,而零售价格则在其之下,这个结果并没给市场预期留下好印象。[46][47]在性能测试中,FX-8150在厂方默认时钟频率下运作,无论待机抑或满负荷运作,能耗比与Intel基于SandyBridge的处理器不相上下,但是进行较大幅度的超频后,FX-8150尽管性能提升明显但处理器会变得极其耗电,能耗比变得相当低下。[48][49][50][51]

Tom's Hardware的网站评论认为,这种在多线程负载下仍然不如预期的性能表现,是由于目前Windows 7的线程和处理器核心一一对应的线程调度方式。他们指出,如果Windows首先把一条线程分配给一个Bulldozer模块,并在模块内分为两条子线程以充分利用该模块内的整数调度运算单元,这将会性能最大化地使处理器同时处理四条线程。这种线程调度方式和带有超线程的Intel微处理器的类似——Windows 7会在利用逻辑核心(超线程得到的)前把线程安排至物理核心上。[52]

对于处理器在超频状态时夸张的功耗水平,业界相信由于格罗方德的32纳米SOI HKMG制程仍旧不成熟,这个导致了处理器核心在更高时脉下运作时,漏电现象严重,使耗电量飙升以及核心发热量大增。[53][54]而且有性能测评指出,AMD为压低FX系列的功耗,有意压低部分型号处理器的最高工作温度,而这个温度的设置值,实际还低于处理器在默认时钟频率下满负荷运作时的最高温度,这样一来在处理器过热保护机制下,性能受到了不小的影响,从而使处理器性能不如预期。[55]

而AMD FX的较低端的型号中,FX-4100系列与Intel Core i3系列之间的比较以及FX-6100系列与Intel Core i5系列(Core i5 2500K除外)之间的比较中,除了某些倚重单线程的应用程式和基准性能测试项目以外,其余的差距不大。不过功耗方面仍然有些偏高,尤其是超频以后功耗仍然大幅增加。[56][57][58][59]

2011年10月13日,AMD在其官方部落格中回应了AMD FX系列处理器的性能、功耗表现不如市场预期的问题,除了指出由于微架构不同于以往的x86处理器的微架构,现行的应用程式以及基准性能测试程序没有对Bulldozer微架构的特点进行充分优化,以至性能不如预期以外,也承认FX-8150性能不济的事实:不少性能测试成绩不如Intel的Core i7-2600K/2700K,甚至比不过AMD上一代的消费级顶级产品Phenom II X6 1100T。AMD同时表示,在2012年以后的发展规划中,将提升Bulldozer微架构的性能,并降低功耗,目标是每一瓦电功率的性能提升10%至15%。格罗方德也表示继续改进其32纳米SOI HKMG制程。[45][60]根据目前一些基于AMD Piledriver微架构的AMD Fusion(核心代号“Trinity”)的工程样品的性能测试,结果显示和AMD的预期性能一致。[61][62]

超级计算机

AMD于2011超级计算机展(Supercomputing 2011)上,宣布基于Bulldozer微架构的新款AMD Opteron 6200系列处理器已被HPCwire杂志的编辑与读者评选为2012年最受瞩目的五款新产品之一,并被美国国家科学基金会(National Science Foundation)的Blue Waters项目采用,将在伊利诺伊州的国家超级计算机应用中心(NCSA)建置此部超级计算机[63]

超过235部,搭载近5万颗AMD Opteron 6200系列处理器的Cray XE6机柜,使Blue Waters超级计算机能提供超过每秒千兆次(petaflop)的充裕性能,在各种现象研究上的获得突破性进展,包括:宇宙大爆炸(Big Bang)之后的演进、龙卷风的形成、病毒侵入细胞的机制,与其他众多科学工程方面的应用。

2012年12月,搭载18,688颗8模块16核心的AMD Opteron 6274为任务分配单元,18,688颗NVIDIA Tesla运算加速卡(GK110通用图形处理器)的泰坦超级计算机以17.59petaFLOPS的记录荣登TOP500第一名,Green500(超级计算机性能功耗比前500强)第三名。[64][65]

性能优化补丁

2011年12月16日,微软发布了KB2592546[66],即传说中的推土机线程调度补丁。而当天上午微软就已经撤下了补丁,对于这一点BSN网站[67]联络了微软和AMD,得到了AMD方面的官方回应:

微软在KB2592546之后,针对以Win7Windows Server 2008 R2的电脑为基础,进行优化。目前,AMD推土机处理器比预期的慢。因为在该两种操作系统的线程逻辑,只对同步多线程(Simultaneous Multithreading, SMT)的调度特色进行优化,而没对集群多线程(CMT,Clustered Multithreading)一类的多线程设计的处理器进行特别优化,来让性能最有效地运行。[67][52][69]

后来完整版的补丁(KB2646060以及KB2645594更新档)发布,不少性能测试结果显示这些性能优化补丁效用有限,无论是伺服器平台还是桌面平台,最多仅在某些项目上有15%的性能增长。[69]

2012.09.21 AMD的驱动程式已有内建修补无需安装微软的修正程序

健力士世界纪录

AMD全球副总裁暨终端产品事业群总经理Chris Cloran表示,等级最高的FX-8150八核心处理器,在2011年8月31日,由AMD团队超频达到8.429GHz,超越同厂处理器先前的被“Team AMD FX”缔造的8.308 GHz成绩,荣登健力士世界纪录“最高时脉的电脑处理器”。[70][71]

改进版本

AMD在2011年发布2012年的财政预算以及2012年的产品路线图时宣布,在2012年的第三季度发布Bulldozer微架构的改进版Piledriver。首批基于Piledriver的处理器是核心代号“Trinity”的AMD A系列处理器(APU)移动版本和桌面版本;新FX和Opteron在2012年9月发布。[72][73]

参考文献

  1. ^ Inside the AMD Bulldozer Architecture. [2012-06-13]. (原始内容存档于2011-07-11). 
  2. ^ 2.0 2.1 AMD's Bulldozer Microarchitecture. [2013-03-19]. (原始内容存档于2013-02-27). 
  3. ^ 3.0 3.1 Bulldozer 50% Faster than Core i7 and Phenom II, techPowerUp, [2012-01-23], (原始内容存档于2012-01-06) 
  4. ^ AMD64 Architecture Programmer’s Manual Volume 6: 128-Bit and 256-Bit XOP, and FMA4 Instructions (PDF), AMD, 2009-05-01 [2009-05-08], (原始内容存档 (PDF)于2009-05-20) 
  5. ^ Striking a balance, Dave Christie, AMD Developer blogs, 2009-05-07 [2009-05-08], (原始内容存档于2012-04-05) 
  6. ^ 2011至2012年最新AMD產品發表時程大公開 (PDF). AMD. 2011第一季 [2011-12-21]. (原始内容 (PDF)存档于2011-04-09) (中文(台湾)). 去年11月9日,AMD在加州阳光谷总公司所举办的2010年度财务分析日上,除了展示2011年初正式面市的AMD Fusion加速处理运算单元(APU)技术,当天也首次公开展示全新一代的高性能x86多核心架构“Bulldozer”,并且揭露并更新关于APU和Bulldozer上市时程的消息。 
  7. ^ AMD Sets New Mark in x86 Innovation with First Detailed Disclosures of Two New Core Designs, AMD: 1, 2011-08-24 [2011-09-18], (原始内容存档于2012-06-14) 
  8. ^ 8.0 8.1 新浪北京. AMD公佈更多Bulldozer處理器消息. 新浪网. 2011-02-24 [2011-02-24]. (原始内容存档于2014-08-26) (中文(香港)). 
  9. ^ Analyst Day 2009 Presentations, AMD, 2009-11-11 [2009-11-14], (原始内容存档于2016-01-21) 
  10. ^ 10.0 10.1 Analyst Day 2009 Presentations. AMD. 2009-11-11 [2009-11-14]. (原始内容存档于2016-01-21). 
  11. ^ Analyst Day 2009 Summary, AMD, 2009-11-11 [2009-11-14], (原始内容存档于2009-11-15) 
  12. ^ AMD bestätigt: "Zambezi" ist inkompatibel zum Sockel AM3, Planet3dnow.de, [2012-01-23], (原始内容存档于2012-01-18) 
  13. ^ soothepain. AMD Zambezi Bulldozer處理器2011年4月登場. 沧者极限. 2010-12-24 [2011-02-24]. (原始内容存档于2019-09-19) (中文(台湾)). AMD Zambezi Bulldozer处理器将有8个核心,采用32nm制程、L3缓存8MB、AM3+脚位设计。同时所搭配的平台“Scorpius”天蝎座,最顶级的将采用990FX北桥搭配SB950南桥,990FX可提供2个PCI-E x16的通道,新的SB950南桥将支持RAID 5、16个USB 2.0、SATA 6Gb/s,很遗憾的并没有原生的USB 3.0。 
  14. ^ 14.0 14.1 机密揭露:Intel超线程技术有多少种?页面存档备份,存于互联网档案馆) - IT168伺服器专区
  15. ^ 全面解析AMD Bulldozer集群多线程架构_组件芯片_服务器频道_至顶网. [2012-06-12]. (原始内容存档于2013-05-13). 
  16. ^ AMD推土机集群多线程/Intel HT全对比 Archive.is存档,存档日期2012-09-17 - 硬派
  17. ^ Bulldozer microarchitecture block, AnandTech, 2010-08-24 [2012-06-12], (原始内容存档于2012-03-30) 
  18. ^ Bulldozer module functional schematic, AMD, 2010-08-24 [2012-06-12], (原始内容存档于2012-10-01) 
  19. ^ More On Bulldozer, Tomshardware.com, 2010-08-24 [2012-01-23] 
  20. ^ AMD Reveals Details About Bulldozer Microprocessors, AMD Reveals Details About Bulldozer Microprocessors, Xbitlabs.com, [2012-01-23], (原始内容存档于2011-09-03) 
  21. ^ Real World Technologies, AMD's Bulldozer Microarchitecture, Realworldtech.com, 2010-08-26 [2012-01-23], (原始内容存档于2011-12-10) 
  22. ^ Bulldozer design power efficiency, AMD, 2010-08-24 [2012-06-12], (原始内容存档于2012-03-30) 
  23. ^ 23.0 23.1 23.2 AP (PDF), [2012-01-23], (原始内容存档 (PDF)于2012-01-20) 
  24. ^ XOP and FMA4 Instruction set in SSE5, Techreport.com, 2009-05-06 [2012-01-23], (原始内容存档于2012-06-05) 
  25. ^ 25.0 25.1 AMD64 Architecture Programmer’s Manual Volume 6: 128-Bit and 256-Bit XOP, FMA4 and CVT16 Instructions (PDF). AMD. 2009-05-01 [2009-05-08]. (原始内容存档 (PDF)于2009-05-20). 
  26. ^ Striking a balance. Dave Christie, AMD Developer blogs. 2009-05-07 [2009-05-08]. (原始内容存档于2012-04-05). 
  27. ^ Striking a balance. Dave Christie, AMD Developer blogs. 2009-05-07 [2009-05-08]. (原始内容存档于2012-04-05). 
  28. ^ AMD Financial Analyst Day 2010, Server Platforms Presentation, Ir.amd.com, 2010-11-09 [2012-01-23], (原始内容存档于2013-11-12) 
  29. ^ AMD Roadmap, [2012-01-23] 
  30. ^ Timothy Prickett Morgan, AMD laughs at Intel with Opteron Bulldozers, theregister.co.uk, 2010-11-15 [2012-01-25], (原始内容存档于2012-02-26) 
  31. ^ 31.0 31.1 31.2 ugmbbc. AMD:桌面推土机将采用AM3+接口兼容AM3处理器. cnbeta.com. 2010-08-28 [2011-12-24]. (原始内容存档于2010-08-31) (中文(中国大陆)). AMD近日公布了下一代处理器架构推土机的大量技术细节,不过还有一个问好萦绕在很多人心头:新架构是否会向Intel那样频频更换新接口而导致无法向下兼容?AMD桌面处理器目前的主力封装接口为AM3,首选搭配AM3插座主板,而之前的AM2+插座主板通过更新BIOS也能支持AM3处理器,只是损失高速HT总线等新特性。 
  32. ^ 32.0 32.1 AMD为数据中心树立价格、性能与功耗新标竿页面存档备份,存于互联网档案馆) - amd.com.tw
  33. ^ AMD Bulldozer FX-8150 vs i7-2600K完整性能测试页面存档备份,存于互联网档案馆),Page1 - VR-Zone中文版
  34. ^ 明年中期上市AMD 9系主板晶片组前瞻页面存档备份,存于互联网档案馆) - CPU新闻_电脑之家PChome.net
  35. ^ 天底下没有永远的敌人,英伟达将SLI能力赋予AMD新一代990晶片组页面存档备份,存于互联网档案馆) - engadget中文版
  36. ^ ASUS confirms AM3+ compatibility on AM3 boards, Event.asus.com, [2012-01-23], (原始内容存档于2013-06-06) 
  37. ^ MSI confirms AM3+ compatibility on AM3 boards, Event.msi.com, [2012-01-23], (原始内容存档于2012-01-16) 
  38. ^ AM3 processors will work in the AM3+ socket, but Bulldozer chips will not work in non-AM3+ motherboards. [2012-06-12]. (原始内容存档于2010-12-10). 
  39. ^ Bulldozer时脉创金氏记录,单核性能被Phenom II打脸?页面存档备份,存于互联网档案馆) - T客邦
  40. ^ 全新「Bulldozer」微架構AMD AM3+處理器產品最新規劃{Page1}. 
  41. ^ Unlock Your Record Setting AMD FX Series Processor Today, Amd.com, [2012-01-23], (原始内容存档于2012-01-22) 
  42. ^ 全新「Bulldozer」微架構AMD AM3+處理器產品最新規劃{Page2}. 
  43. ^ 43.00 43.01 43.02 43.03 43.04 43.05 43.06 43.07 43.08 43.09 43.10 43.11 udn数码资讯. AMD全新Opteron處理器伺服器更具效能、更省電. 联合新闻网. 2011-11-14 [2011-11-24]. (原始内容存档于2014-08-26) (中文(台湾)). Intel在今天正式宣布Sandy Bridge-E系列处理器解禁消息,AMD阵营则是在同一天宣布推出针对伺服器等级性能的Opteron 6200与4200系列处理器(先前代号分别为Interlagos与Valencia),主要提供企业更具性能的虚拟化运算,但整体耗电量却更少的表现。 
  44. ^ 44.00 44.01 44.02 44.03 44.04 44.05 44.06 44.07 44.08 44.09 44.10 44.11 新款AMD Opteron™处理器带来极致的性能、扩展性与效率页面存档备份,存于互联网档案馆) - AMD.COM.TW
  45. ^ 45.0 45.1 效能居然倒退?AMD FX与Intel P4的故事_CPU内存硬盘评测. [2011-11-09]. (原始内容存档于2011-10-25). 
  46. ^ [www.mobile01.com/newsdetail.php?id=11386 AMD Phenom II X6 1100T与同门FX-8120性能解析] - Mobile01
  47. ^ AMD Bulldozer FX-8150 vs i7-2600K完整性能测试页面存档备份,存于互联网档案馆) - VR-Zone中文版
  48. ^ Bulldozer Has Arrived: AMD FX-8150 Processor Review, X-bit labs: 13, 2011-10-11 [2012-01-23], (原始内容存档于2012-01-13) 
  49. ^ Bulldozer Has Arrived: AMD FX-8150 Processor Review, X-bit labs: 14, 2011-10-11 [2012-01-23], (原始内容存档于2012-01-16) 
  50. ^ 全方位认识推土机:AMD FX-8120最全面解析与评测_文库_PC绝对领域. [2012-05-12]. (原始内容存档于2012-07-25). 
  51. ^ 终极版超频FX-8150同i7-2600K对比测试页面存档备份,存于互联网档案馆) - 新浪数码
  52. ^ 52.0 52.1 Tom's Hardware review", Tomshardware.com, 2011-10-12 [2012-01-23] 
  53. ^ 对决推土机、APU:Core i7-2700K全方位评测-Intel,Core i7-2700K,i7-2600K,推土机,FX-8150,对比,评测-驱动之家. [2011-10-27]. (原始内容存档于2011-10-27). 
  54. ^ AMD Bulldozer FX-8150 vs i7-2600K完整性能测试页面存档备份,存于互联网档案馆),Page8 - VR-Zone中文版
  55. ^ 全方位认识推土机:AMD FX-8120最全面解析与评测页面存档备份,存于互联网档案馆) - pceva.com.cn
  56. ^ 史上最高频!AMD推土机FX-4170性能测试页面存档备份,存于互联网档案馆) - 硬派
  57. ^ AMD FX Vs. Intel Core i3: Exploring Game Performance With Cheap GPUs - Tom's Hardware.com
  58. ^ 同样的显卡:i3-2100、FX-4100谁更快?页面存档备份,存于互联网档案馆) - 驱动之家
  59. ^ 结果竟然是?AMD六核推土机FX-6100评测页面存档备份,存于互联网档案馆) - pconline.com.cn
  60. ^ Our Take on AMD FX, Blogs.amd.com, 2011-10-13 [2012-01-23], (原始内容存档于2012-07-07) 
  61. ^ AMD Trinity On The Desktop: A10, A8, And A6 Get Benchmarked! - Tom’s hardware
  62. ^ 大起底!AMD台式电脑版Trinity APU首测页面存档备份,存于互联网档案馆) - 驱动之家翻译自Tom's Hardware
  63. ^ 屡获奖的新款AMD Opteron™处理器打造全球顶尖超级计算机
  64. ^ Oak Ridge Claims No. 1 Position on Latest TOP500 List with Titan. TOP500. 2012-11-12 [2012-11-15]. (原始内容存档于2013-01-21). 
  65. ^ Williams, Leo. Titan is Also a Green Powerhouse. Oak Ridge Leadership Computing Facility. 2012-11-14 [2012-11-15]. (原始内容存档于2013-02-16). 
  66. ^ 在【更新】以最佳化AMD Bulldozer Cpu的效能. [2011-12-17]. (原始内容存档于2011-12-18). 
  67. ^ 67.0 67.1 Theo Valich. Microsoft Releases AMD Bulldozer Patch by Mistake: Incomplete Update. Bright Side Of News. 2011-12-16 [2011-12-21]. (原始内容存档于2012-01-07) (英语). 
  68. ^ 68.0 68.1 ChrisR. AMD:微软的推土机补丁不完整就拿出来了. 驱动之家. 2011-12-17 [2011-12-21] (中文(中国大陆)). 昨日微软发布了KB2592546,即传说中的推土机线程调度补丁,不过据实测结果来看,理论性能方面几乎没有什么变化,反倒是WinRAR性能大幅降低。游戏性能方面目前并没有人拿出可信服的数据来证明有提升幅度。 
  69. ^ 69.0 69.1 安装Windows 7更新档,实测AMD FX处理器性能增加多少? - 第3页页面存档备份,存于互联网档案馆) - T客邦
  70. ^ Matt Kan. 金氏世界紀錄超頻秀登「台」 八核心推土機處理器來囉!. 今日新闻网. 2011-10-14 [2011-12-24]. (原始内容存档于2011-12-17) (中文(台湾)). 
  71. ^ AMD Bulldozer CPU beats world record again achieving 8.461GHz. [2013-03-19]. (原始内容存档于2012-04-28). 
  72. ^ AMD移动产品Roadmap曝光,2012 Q1 Llano接班人Trinity上场页面存档备份,存于互联网档案馆) - T客邦
  73. ^ AMD下代APU改用“Piledriver”微架构13年升级至28nm进入异类多核心时代页面存档备份,存于互联网档案馆) - hkepc

外部链接

参见