分类分类
关注+2004-10-08作者:蓝点
千呼万唤始出来
美国当地时间9月23日,也就是在孪生兄弟Opteron(研发代号SledgeHammer)正是发布的5个月之后,AMD终于发布了面向台式机和笔记本的64位处理器:Athlon 64 (研发代号ClawHammer)和Athlon 64 FX。迄今为止,64位的处理器的应用领域仅仅限于高端服务器和工作站,而且售价都在数千美元的水平,所以今天基于AMD64架构的桌面平台的出现具有不同寻常的意义。正如AMD执行副总裁兼市场营销总监Rob Herb表示:“AMD位全球个人电脑用户提供性能强劲的AMD64平台,带领电脑业开拓一个全新的发展方向。”
这次发布的四款全新处理器分别为:针对高端游戏平台的Athlon 64 FX-51,针对高性能桌面平台的Athlon 64 3200+以及为高性能笔记本电脑独身定造的,具有PowerNow!技术的Athlon FX 3200+和3000+ DTR(Desktop Replacement)处理器。所有处理器均采用了1MB的二级缓存,128KB的一级缓存,并且支持AMD最新的HyperTransport技术。
新处理器的运行频率并没有现在的AMD处理器高,其中Athlon FX-51的运行频率为2.2GHz,Athlon 64 3200+和3000+的运行频率分别为2.0GHz和1.8GHz。
图为:针对高端游戏平台的Athlon 64 FX-51
图为:针对高性能桌面平台的Athlon 64 3200+
图为:针对笔记本的Athlon 64处理器
针对笔记本的Athlon 64处理器,具备1MB容量L2缓存,以及DDR内存控制器;采用了“AMD PowerNow!”省电技术,支持PC2700内存,3200+的工作频率2.0GHz,3000+的工作频率为1.8GHz。
售价方面,Athlon 64 3200+桌面平台版的千颗单价为417美元,移动版的Athlon 64 3200+和3000+的千颗售价为417美元和278美元,高端的Athlon 64 FX-51的售价则达到了733美元。
Athlon64/Athlon64 FX销售计划(单位:万颗) | ||||
| Q3 | Q4 | Q1 | Q2 |
940接口 | 10 | 15 | 30 | 0 |
939接口 | 0 | 0 | 300 | 1520 |
754接口 | 80 | 433 | 1320 | > 3600 |
总数量 | 90 | 448 | 1690 | 5120 |
至于接口界面,Athlon64 FX比Athlon增加了一倍有多,采用和Opteron相同的Socket940接口,而主流的Athlon64则采用成本较低的Socket754接口。在未来一段时间内,Athlon64都会采用Socket754接口,而Athlon64 FX的Socket940接口会向Socket939过渡。根据AMD的销售计划,2004年1季度,Socket940 Athlon 64处理器的销售量达到25万颗,Socket754Athlon 64处理器的销售量达到125万颗。2004年2季度预计Socket939 Athlon64处理器的销售量将达到300万颗。
如果说高端Opteron处理器有望帮助AMD在利润丰厚的高端工作站和高端服务器领域分一杯羹的话,那么面向低端工作站以及主流个人平台的Athlon64的发布不但让AMD重新找到了与Intel Pentium4抗衡的有力工具,而且是AMD实施AMD64架构的重要一步。
发展历程
还在AMD Athlon处理器炙手可热的时候,AMD便已经将大量的资源投入到下一代处理器——K8的研发当中。事实上,自从AMD披露有关K8处理器信息的那一刻开始就已经注定了AMD的新一代产品将会成为万众瞩目的焦点。人们的关注源于AMD不但是首个尝试将高端领域的64位处理器带到低端桌面领域的微处理器制造商,还是让64位处理器能同时兼容64位程序和32位程序的第一人,加上AMD为K8冠以分量十足的研发代号“Hammer(大锤)”,开创桌面64位时代的美好愿望以及架构上的革命性创新使AMD K8长期处于媒体的聚光灯下。
然而AMD新一代处理器的研发过程并不顺利,处理器的一再延期推出不但使芯片组供应商陷入了进退两难的境地,同时也引发了媒体的种种猜测——难道AMD真要倒下去了吗?随着AthlonXP渐渐走向迟暮,改进的Barton核心在来势汹汹的Pentium4面前颇有螳臂当车的味道,AMD近几个季度的巨额亏损也暴露了这一问题。AMD自己也清楚新一代处理器的上市时间是越快越好,只有这样才可能扭转目前的困境,然而作为一款蕴含了多种创新技术的产品,研发过程中所要面对的难题自然也会更多。
分析过去一段时间媒体断断续续的报道,我们得出Hammer一再延期的原因不在于32位/64位的指令兼容和效能问题,而是长期阻碍AMD处理器频率提升的制造工艺问题——主要是绝缘硅(SOI)技术的应用,以至于很长一段时间AMD只能拿出800MHz的样品用作展示和媒体测试。按照最初计划,Barton理应是采用SOI的Thoroughbred,但最后变为L2为512KB的Thoroughbred,这项改变也间接证明了SOI技术上的困难。年初与IBM的技术合作解决了AMD在SOI使用上的燃眉之急,Opteron和Athlon64处理器的频率也得以提高到目前较合理的水平。另一方面,由于新处理器整合了内存控制器,而在研发过程中内存标准进行了多次升级,并且双通道内存技术成为了主流,因此AMD也不得不临时修改了新处理器的内存控制器架构,这也给Athlon64的按时上市增加了难度。
但不管如何,经过了漫长的等待,广大玩家还是高兴地迎来了属于桌面平台的第一颗64位处理器——Athlon64,究竟AMD的最新力作有什么值得炫耀的地方呢?且看我们细细道来……
AMD64处理器——技术结晶
什么是AMD64? |
AMD64是AMD由业界标准的x86指令集架构发展而来的64-bit全新计算框架。AMD64平台是业界首个可以完全兼容现有x86方案和64-bit方案的高性能平台。随着这个计算架构的定型,AMD改称“Hammer”为AMD64处理器,而“x86-64”则改称为“AMD64 ISA”。 |
核心架构
毫无疑问,AMD64处理器的复杂程度要超出以往任何一款桌面处理器——“这些产品是如此复杂,技术改进是如此巨大,在我29年业界的生涯中,我从来没有看到过象Hammer如此复杂的产品,当芯片刚刚出来时,它是可以工作的,完全可以工作...这已经令人惊讶了!”......AMD CEO Ruiz的这番感慨也深刻地印证了这一点。
AMD64处理器的核心架构几乎是完全一致的
我们可以看到AMD64处理器的核心架构几乎是完全一致的,只是在内存控制器、DDR内存接口、Hyper Transport接口以及多路处理器控制电路等方面存在细微差异。尽管该核心集成了1亿500万晶体管,核心面积达到193平方毫米,但超过一半的核心面积是被1MB容量的二级缓存所占据,我们也不难想象增加CPU缓存容量所要付出的代价有多高。新核心包括9组功能单元(3组ALU、3组AGU、FADD、FMUL和FMISC,包括3组整数和3组浮点运算器)以及3组x86译码器。一级缓存的容量上也没有发生变化,指令缓存和数据缓存各64KB,总容量128MB,同时增加了ECC校验电路。
Athlon64核心架构 | AthlonXP(Barton)核心架构 |
除去二级缓存,时钟发生器,内存控制器,DDR内存接口以及Hyper Transport接口这些外部单元,将剩下的Athlon64处理器核心部分(整数/浮点单元、指令/数据缓存等)与AthlonXP的核心架构对比,我们发现它们之间相似程度更高,两者的布局完全一致,只是在电路设计方面作了调整。
作为AMD的第八代处理器,K8实质上是K7架构的进一步发展和改进。
K8实质上是K7架构的进一步发展和改进
如果你了解K7的架构,你便会发现它与AMD64处理器的架构惊人地相似。除64位模式以外,AMD64处理器和Athlon有着极为相似的指令执行模式。
虽然架构相近,但AMD64处理器的核心是经过改进的,两者的异同主要有以下几点:
一级缓存维持原有的128KB,其中64KB为指令缓存,64KB为数据缓存。根据AMD64处理器的架构,二级缓存的寻址能力允许二级缓存的容量在1MB到8MB之间。但尽管Athlon已经可以支持8MB的二级缓存,但事实上AMD从来没有这样做。服务器市场是AMD64处理器的一个主攻目标,所以大于1MB的二级缓存是十分有必要的。另外AMD未来还将会使用三级缓存。AMD64处理器的管线长度比Athlon增加了两级,这使得它可以运行在更高的频率上。
AMD64处理器在分支预测单元上作了改进。
AMD64处理器支持更大的翻译后备缓冲区(TLB)。
由于Athlon有着极高的运行效率,因而对于改进了设计的AMD64处理器自然不必多作怀疑。这些惊人的相似直接解析了为什么Athlon64的PR值仅比相同时钟频率的AthlonXP稍高,不要忘记所高出的部分很可能来自于二级缓存容量的增加以及内存延迟的降低。
图为:Athlon64处理器架构
但如果简单地认为Athlon64仅仅是AthlonXP的升级版那就大错特错了,Athlon64的技术亮点来自于3个方面的完美结合:AMD64 ISA处理核心整合DDR内存控制器并采用HyperTransport总线接口。
AMD64 ISA(x86-64)的基本架构原理
在了解这个架构之前,弄清楚一个问题是十分重要的——为什么需要64位处理器?需要64位处理器的原因十分简单,当今软件的迅速发展对硬件资源提出了很高的要求,高性能的处理器和大容量的物理(虚拟)内存寻址空间成为必须。4GB内存在今天已不是什么天文数字。而32位处理器最多仅能支持32位寻址,所以目前的32位x86架构系统的内存容量被限制在4GB,而32-bit操作系统一般只能管理2GB左右的内存,这也意味着应用程序所能使用的最大内存数量其实并不如人们想象的那样充裕。尽管Xeon可以模拟36位寻址,最大内存容量可以达到64GB,但另一方面也会导致性能的下降。考虑到种种制约,人们开始考虑发展64位处理器。
AMD64 ISA是AMD专门为AMD64平台开发的64位架构。与目前Itanium使用的64位IA64架构不同,AMD64 ISA是基于目前的x86-32架构的。这就意味着AMD64处理器可以畅通无阻地运行目前的32位应用程序,而且不需要像Itanium那样进行模拟转换,AMD64处理器可以实现全速运行,因此我们使用AMD64处理器的时候时也不需要等待软件厂商为新平台开发专用软件。Hammer在继承了K7系列的优点的同时灌注众多先进技术。
为了实现64位运算,Hammer处理器在寄存器阵列仲新增了寄存器,以实现对现有架构的扩展。
新增了R8-R15 8个通用寄存器
从图中可以看到,使用64位架构后,新增了R8-R15 8个通用寄存器,原有的SSE单元也新增了8个寄存器使其能够支持SSE2。存储器容量
15年前,i386开启了32位时代,当时CPU的寄存器从i286的16位AX寄存器扩展为32位的EAX寄存器。而现在要进入64位时代,EAX寄存器又需要扩充32位而成为RAX寄存器。从结构上看,Hammer对32位程序的兼容程度是不需要怀疑的,尽管运行32位程序时并不是满负荷运行。
为了能够同时支持32位及64位程序,x86-64架构允许处理器有两种工作模式:包括两种子模式(64位模式和兼容模式)的“长模式”和传统模式。
工作模式 | 操作系统 | 是否需要再编译 | 默认 | ||||
地址长度 | 操作数位数 | 附加寄存器 | 通用寄存器位数 | ||||
长模式 | 64bit | 需要 | 64 | 32 | 需要 | 64 | |
兼容模式 | 不需要 | 64 | 不需要 | 32 | |||
传统模式 | 32bit 或 64bit | 不需要 | 32 | 32 | 不需要 | 32 | |
16 | 16 |
64位模式支持以下功能:
64位虚拟地址;
通用寄存器扩展到64位(包括旧有的“EAX”,“EBX”等);
新增8个64位通用寄存器;
64位程序指针;
新的程序指针实现相对寻址;
单一的指令,数据和堆栈空间组成连续的地址空间。
兼容模式提供了64位操作系统对现有的16位和32位应用程序的支持。该模式有其独立的代码处理方式,称为保护模式。在这种模式下,应用程序会将处理器当作标准的x86处理器;但操作系统则会对这种机制进行地址变换,将中断、异常及系统数据结构当作64位长模式来处理。
除了长模式之外,x86-64支持传统模式以兼容16位和32位操作系统。在这种模式下,Hammer就是一个标准的32位x86处理器,使用32位的内存段,32位的通用寄存器和程序指针。这种模式并不牵涉任何64位架构模式,所以保证它有绝对的兼容性。
从上面可以看到,Hammer可以完全支持64位长模式的操作系统。目前微软的WindowsXP Professional,Windows2003 Server以及Windows Media Center都为AMD64提供了64bit版本,主流桌面平台和工作站平台的操作系统应该不存在什么问题了;而高端服务器方面SuSE Linux会是一个不错的选择。因此我们不必再担心AMD64处理器的操作系统支持问题,反倒是64位应用软件目前还比较贫乏,但相信不少软件商都愿意往64位平台靠拢。
全新构思:CPU内整合内存控制器
AMD64处理器技术上最大的变革在于CPU核心整合内存控制器。Transmeta的Crusoe处理器就是采用这种架构,而AMD则打算进一步扩展这一架构。CPU内建内存控制器的主要优点在于内存控制器可以以CPU频率运行,比起传统上位于北桥的内存控制器有更小的延时;而且CPU的频率越高,延时就越小。
这样做的另一个好处就是AMD不再需要依赖主板厂商的内存控制器。由于主板内存控制器性能不佳而导致内存性能低下并不是什么新鲜的事情,这样做不但AMD64处理器的性能更有保障,而且主板厂商也可以避免出现内存兼容性的问题。由于内存和CPU之间的数据传输再不需要经过CPU总线,所以可以避免瓶颈的出现。
要了解AMD64处理器内存控制器的工作原理,请看下图:
图为:AMD64处理器内存控制器的工作原理
图中可以看到,处理器内封装了内存控制器(MCT)和DRAM控制器(DCT)。MCT是处理器核心和DCT之间的连接界面,它不因为外部内存的类型而改变。相反DCT则是专门针对DRAM的内存连接界面,系统使用不同类型的内存可以通过改变这一部分来实现支持。由于这一部分只是整个处理当中很小的一部分,所以要作出修改以支持不断发展的内存标准并不需要花费太大的力气。
AMD64处理器整合的内存控制器提供了64位和128位界面,目前整合的DCT支持PC1600/2100/27003200的DDR内存标准,也就说可以支持单通道和双通道的DDR内存。另外鉴于AMD64处理器要主攻服务器市场,所以支持ECC内存也是顺理成章的事。
AMD64处理器整合的内存控制器提供了64位和128位界面
在目前已推出的AMD64处理器当中,Opteron和Athlon64 FX-51都整合了双通道DDR内存控制器,内存峰值带宽可达6.4GB/s,而Athlon64则只支持单通道DDR内存,配搭PC3200时内存带宽为3.2GB/s。AMD声称其内存控制器可以支持未来的内存标准,所以随后DDRII或其他内存标准推出以后,相信AMD会作出相应的修改。
Hammer整合了内存控制器之后,主板厂商很有可能会推出单一芯片的芯片组。因为传统意义上的北桥在省缺了内存控制器之后就只剩下了AGP控制器,而这一部分又很容易整合到南桥芯片中。nForce3 Pro150便是这样一款单一芯片的芯片组。Hammer整合内存控制器的设计简化了主板的设计,也降低主板成本,更有利于配套主板的普及和市场推广。
扫除瓶颈:HyperTransport超级总线
HyperTransport是AMD公司最新开发的一种新型、高速、高性能的为主板上的集成电路互联而设计的端到端总线技术,该技术设计的目的是解决32位和64位处理器系统中的输入输出瓶颈问题。HyperTransport可以提供比PCI、PCI-X和AGP等输入输出总线体系结构高一个数量级的总线数据处理量,并且可以广泛应用到服务器、工作站、网络转换器以及嵌入式应用设备当中。
HyperTransprot特性及功能概要 | |
总线类型 | 双点对点单向链路 |
连接位宽 | 2,4,8,16或32位 |
协议 | 基于4字节(32位)数据包传输,数据包包括请求、响应、广播三种类型,每种类型的包都可以提供命令、地址或数据信息 |
带宽 | 100-6400MB/s |
数据信号频率 | 400MHz-1.6GHz |
工作频率 | 400,600,800,1000,1200和1600百万次传输/秒 |
双工 | 全双工 |
最大负载包或突发数据长度 | 64Bytes |
电源管理 | ACPI兼容 |
信号 | 使用100欧姆终端电阻的1.2V低电压差分信号(LVDS) |
在AMD64平台当中,HyperTransport总线用于连接处理器和芯片组或芯片组之间。对于多路处理器系统,每一个处理器都使用了额外的HyperTransport控制器以实现处理器之间的互联。究竟HyperTransport总线有什么优点呢?简单来说,它有着高速度,低延时,结构简单等优点。虽然每路HyperTransport总线仅由两条端到端的单向数据传输路径组成(一条为输入、一条为输出),但极限数据传输率竟可以达到惊人的6400MB/s,可以通过设置2,4,8,16或32bit的位宽和400,600,800,1000,1200,1600MHz的工作频率来得到从100MB/s到6400MB/s的数据传输率。举个例子,用于连接多路Hammer处理器系统的HyperTransport总线可以提供每路3200MB/s的带宽。
由于HyperTransport标准是开放的,所以其他生产商业可以参与到产品的研发中来。当要在系统中实现新功能或增加总线带宽时,只要增加额外的HyperTransport接口就可以了。
较低端的Athlon64仅有一个HyperTransport接口,而Opteron和Athlon64 FX-51则具有3个HyperTransport接口
事实上AMD就是这样做的,在现有的处理器当中,较低端的Athlon64仅有一个HyperTransport接口,而Opteron和Athlon64 FX-51则具有3个HyperTransport接口,这些接口除了用于连接芯片组之外,还可以在多路处理器系统中用于CPU之间的互连通信。
由于系统总线的瓶颈问题已经由来以久,HyperTransport总线的应用能很好地解决处理器之间,桥芯片之间以及处理器与桥芯片之间的高速互连问题,因此AMD64平台除了具备优秀的总线效能之外,在周边设备的配搭上更具灵活性。
正是由于AMD64处理器具有如此突出的技术优势,所以各大厂商和众多个人用户才在它身上寄予了深切的期望。究竟AMD真能凭借它们的新产品给Intel以沉重打击吗?我们的评测或许会帮助大家解答这个问题。
产品介绍
下面便是这次评测的主角——AMD Athlon64 3200+和Athlon64 FX-51。
AMD Athlon64 3200+规格参数
接口封装:Socket 754有机材质mPGA封装;
实际频率:2.0GHz;
PR值:3200+;
核心面积:193平方毫米;
晶体管数目:1.059亿个;
L1 Cache:容量128KB,64KB指令缓存,64K数据缓存;
L2 Cache:容量1MB,全速;
工艺:基于SOI 0.13微米工艺;
工作电压:1.5V;
内存支持:72bit(单通道)DDR200/266/333/400(ECC & Non-ECC)DDR SDRAM;
指令集支持:
AMD64指令;
MMX & 3DNow!指令;
SSE & SSE2指令;
传统x86指令;
HyperTransport接口数:1个。
图为:Athlon64
外观上,Athlon64与AMD前几代处理器相比最大的改变来自于封装方式。随着目前处理器的设计日趋复杂,信号针脚的增加已是不可避免,加上Athlon64能够进行64位操作,因此寻址、数据针脚势必大增。Athlon64的针脚数达到了754根,比AthlonXP整整增加了292根针脚,从一个侧面也反映了处理器设计的复杂。
另一个喜人的改变在于AMD终于借鉴了Pentium4的设计为脆弱的CPU核心装上了保护罩,以往司空见惯的散热器压坏核心的惨痛经历将一去不复返。金属罩和CPU核心之间的导热材质会将核心的热量迅速、均匀地导出,除了让处理器和散热器有更理想的接触面积之外,也可以防止CPU核心因瞬时热量堆积而烧毁。
Athlon64处理器将统一由位于德国的德累斯顿的Fab30晶圆厂负责生产,这颗Athlon64处理器的编号为ADA3400AEPSAO,在马来西亚装配。虽然标识显示这颗Athlon64测试样本的PR值是3400+,但经过我们实际运行证实它的工作频率为2GHz,按照AMD最新的产品信息应该是3200+。记得当初AMD在测试期间曾将2GHz的Athlon64标识为3400+,但在Athlon64最终上市之前降低到了3200+。
AMD Athlon64 FX-51规格参数
接口封装:Socket 940陶瓷封装;
实际频率:2.2GHz;
PR值:--;
核心面积:193平方毫米;
晶体管数目:1.059亿个;
L1 Cache:容量128KB,64KB指令缓存,64K数据缓存;
L2 Cache:容量1MB,全速;
工艺:基于SOI 0.13微米工艺;
工作电压:1.5V;
内存支持:64bit(单通道)/128bit(双通道) DDR200/266/333/400 (Registered+ECC),最大容量4GB;
指令集支持:
AMD64指令;
MMX & 3DNow!指令;
SSE & SSE2指令;
传统x86指令;
HyperTransport接口数:3个。
图为:Athlon64 FX-51
和Athlon64的有机质封装不同,Athlon64 FX-51的封装方式源于Opteron的Socket940陶瓷封装。事实上无论是外观,还是功能特性,我们都有理由相信Athlon64 FX-51是Opteron的简化版。Athlon64 FX-51的针脚数量达到惊人的940pin,比Socket754还多了186pin,额外的针脚主要为双通道内存控制器和HyperTransport界面作出定义。不过Socket940像当年Athlon的SlotA一样只不过是一个过渡型的接口,AMD将在明年3月底发布研发代号为San Diego的Athlon 64 FX处理器,这种处理器将采用0.09微米制程,所使用的Socket939接口将会有更长的生命期。
AMD新旧处理器规格参数一览 | |||
Athlon64 FX-51 | Athlon64 3200+ | AthlonXP 3200+ | |
接口 | Socket940 | Socket754 | Socket462 |
封装 | 陶瓷封装 | 有机封装 | 有机封装 |
实际频率 | 2.2GHz | 2.0GHz | 2.2GHz |
核心面积 | 193平方毫米 | 193平方毫米 | 101平方毫米 |
晶体管数 | 1亿500万 | 1亿500万 | 5400万 |
制造工艺 | 0.13微米SOI | 0.13微米SOI | 0.13微米 |
工作电压 | 1.5V | 1.5V | 1.65V |
一级缓存 | 128KB(64KB 指令+64K 数据) | 128KB(64KB 指令+64K 数据) | 128KB(64KB 指令+64K 数据) |
二级缓存 | 1024KB | 1024KB | 512KB |
内存类型 | Registered+ECC | ECC &Non-ECC | ECC &Non-ECC |
内存速度 | DDR200/266/333/400 | DDR200/266/333/400 | DDR200/266/333/400 |
是否支持双通道 | 支持 | 不支持 | 通过芯片组支持 |
HyperTransport接口数 | 3 | 1 | - |
是否支持多路处理器 | 不支持 | 不支持 | 不支持 |
指令架构 | AMD64 & x86 | AMD64 & x86 | x86 |
多媒体指令集支持 | MMX /3DNow!/SSE/ SSE2 | MMX /3DNow!/SSE/ SSE2 | MMX /3DNow!/SSE/ SSE2 |
测试平台
Athlon 64平台(采用VIA K8T800芯片组)
图为:Athlon 64平台
Athlon 64 FX平台(采用nVidia nForce 3 Pro 150芯片组)
图为:Athlon 64 FX平台
图为:nVidia nForce 3 Pro 150芯片组
图为:特制的散热风扇
测试说明
硬件平台 | |
64位Athlon FX平台 | CPU:Athlon 64 FX-51(1MB L2 Cache、2.2GHz) 主板:ASUS SK8N(nForce 3 Pro 150) 内存:DDR400 SDRAM(REG+ECC) 512MB×2 |
64位Athlon平台 | CPU:Athlon 64 3200+(1MB L2 Cache、2.2GHz) 主板:ASUS K8V Deluxe(K8T800) 内存:南方高科 DDR400 SDRAM 256MB×2 |
32位Pentium平台 | CPU:Athlon XP 3200+(512KB L2 Cache、2.2GHz) 主板:Aopen AK66 Max(KT600) 内存: 南方高科 DDR400 SDRAM 256MB×2 |
32位Athlon平台 | CPU:Pentium 4 3.2C(512KB L2 Cache、3.2GHz) 主板:MSI 875P Neo(i875P) 内存: 南方高科 DDR400 SDRAM 256MB×2 |
硬盘 | WD Raptor 36.7GB×2(通过主板的Promise PDC20378芯片,组建成RAID 0) |
显卡 | Leadtek A350 Ultra TDH MyVIVO(Geforce FX5900 Ultra、256MB) |
软件平台 | |
系统软件 | Windows XP+SP1 英文版 Direct X 9.0b 英文版 |
驱动程序 | VIA 4 in 1 driver Package Service v4.48 Intel Software Installation Utility 5.0.2.1002 nVidia Detonator FX Driver 52.13 Beta版 Promise FastTrak 378 RAID Driver V1.00.1.37 |
测试软件 | ZDNet Business Winstone 2002 ZDNet Content Creation Winstone 2003 Futuremark SYSMark 2002 Futuremark 3DMark 2001 SE Futuremark 3DMark 03 Auqamrk 3 LAME Super Pi Xmpeg Windows Media Encorder 9 Specviewperf 7.1 Quake III Arena Sisoft Sandra 2004 PCMark 2002 Pro |
由于目前能够运行在64位操作系统里的应用软件非常少(下面还有专门的测试证明这一点),测试Athlon 64在64位操作系统下的情况还是不够现实的,于是本次的重点测试放在32位操作系统下进行。为了尽量保证4个平台的测试数据对比更具对比价值,我们采用的4款主板上均集成Promise的磁盘阵列控制芯片,通过该芯片组将两个WD Raptor硬盘组建成RAID 0阵列,保证了4个平台在磁盘性能上的一致。
测试结果
AMD Athlon64 3200+CPU信息
AMD Athlon64 FX-51 CPU信息
CPU性能测试
CPU的性能是测试结果的重中之重。
由于各个测试软件测试的侧重点不同,所以测试的结果也不太统一,但来来去去优胜者莫过于Athlon64 FX-51和Pentium4 3.2C。算术运算一直是Athlon处理器的强项,3者联手让Pentium4只有招架之功,幸好在Sandra多媒体运算和PCMark中Pentium4轻松取回两项第一。最新的3D测试软件Aquamark中加入了CPU性能得分以反映CPU的游戏性能,测试结果一边倒地由AMD一方获胜,Athlon64 FX-51独占熬头,Athlon64 3200+紧随其后,Pentium4在这个测试中表现并不理想,在SuperPi中尽管有出色表现,但风头仍被Athlon64 FX-51所盖过。而Athlon64的总体性能优于Barton是不需要怀疑的了,但比起主要竞争对手Pentium4 3.2C似乎有些力不从心,不禁让AMD的支持者们大失所望。
内存性能测试
内存通道数将测试平台分为了两大阵营。首先同样使用双通道DDR400内存的Pentium4 3.2C和Athlon64 FX-51表现十分优异,在Sisoft Sandra内存带宽测试中得分双双超过了5000分。其中Athlon64 FX-51整合内存控制器的设计在测试中得到了回报,首度让AMD平台的内存性能超越了依靠865PE/875P的双通道内存技术横行以久的Pentium4平台。而仍然维持单通道架构的Athlon64的处境则比较艰难,和AthlonXP3200+一起被抛离在了后面。
PCMark的内存性能测试比较注重内存延时的因素,因此Athlon64 3200+凭借整合内存控制器的超低延时得以和AthlonXP 3200+拉开距离,但受带宽所限,和第二名的Pentium4仍有一段距离。
图形系统测试
为了充分体现CPU对图形系统的影响,我们特意在测试时降低游戏的分辨率,让CPU成为游戏瓶颈以反映几款CPU的性能。
看过测试结果,大概我们可以认定基于Athlon64 FX-51的平台是目前最理想的游戏平台,在三个基准测试中遥遥领先,轻松胜出。让人惊喜的是先前在CPU测试中表现并不出色的Athlon64 3200+在游戏性能方面有不俗的表现,尽管没有双通道的内存带宽,但还是大幅抛离了AthlonXP3200+,看来AMD64架构十分适合于游戏应用领域。
在专业图形设计领域,Pentium4得到不少软件的专门优化,因此Athlon处理器很难占到甜头,除了drv-08外,所有测试都被Pentium4 3.2C占据了首位。
多媒体应用测试
在多媒体应用当中,情况和专业图形领域有些相似,但Pentium4显然受到了来自Athlon64 FX-51和Athlon64 3200+的强劲挑战。LAME MP3压缩测试显然受内存性能的影响比较明显,结果和内存性能测试结果一致。在两个视频压缩测试中,AMD打破了Intel的垄断,Pentium4和Athlon64各折一桂,两者表现实在难分高下。
综合应用测试
在权威的整机测试软件Winstone当中,商用软件测试和多媒体软件测试呈现出折然不同的结果。Business Winstone当中,除Athlon64 FX-51遥遥领先之外,所有AMD平台都有出色的表现;而在此失意的Intel平台则在多媒体软件测试中报了一箭之仇。Athlon64 FX-51由于nForce3芯片组的Bug而无法完成Multimedia Content Creation Winstone 2003测试,因此Pentium4 3.2C少了一个强劲的对手。但从Pentium4 3.2C的领先优势来看,取得这个测试的第一似乎没有什么悬念。
AMD曾不止一次向Bapco声明自己对Sysmark测试结果的不满,虽然新处理器未能改写形势,但至少我们看到Athlon64 FX与Pentium4C的测试结果已是相当接近了。
64位平台应用测试
由于目前可供Athlon64使用的64位操作系统并不丰富,应用软件也不多,因此我们并不打算进行详细测试。我们在测试当中安装了WindowsXP Professional 64bit Edition,系统安装正常,不过目前厂商的驱动并未完善,因此部分设备仍然未能正常安装。
由于Athlon64在64位操作系统下可通过兼容模式运行传统32位或16位程序,为了测试其软件兼容性,我们尝试执行上面的测试过程。结果如下:
64位操作系统下32位软件运行情况 | |
Business Winstone 2002 | 不能安装 |
Content Creation Winstone 2003 | 不能安装 |
Sysmark 2002 | 不能安装 |
3DMark2001SE | 可以运行,因驱动问题死机 |
3DMark2003 | 可以安装不能运行 |
Aquamark3 | 可以安装不能运行 |
L.A.M.E V3.93.1 | 正常运行 |
SuperPI | 正常运行 |
Xmpeg 5.0 | 正常运行 |
Windows Media Encoder 9 | 不能安装 |
SpecViewperf7.1 | 可以运行,驱动影响性能低 |
Quake III Arena | 可以安装不能运行 |
Sisoft Sandra 2004 x86-32 | 正常运行 |
PCMark2002 pro | 可以安装不能运行 |
总的来说,目前的32位软件在64位操作系统下运行普遍存在问题,不过Athlon64能够在64位操作系统中直接运行32位软件已经算得上是一个重大突破,我们只能期待软件商推出更多支援64位操作系统的软件来丰富我们的桌面64位平台。我们将可以在64位操作系统下正常运行的几个测试软件的测试成绩与32位操作系统下的成绩作了对比:
32位软件在32位操作系统和64位操作系统下的性能对比 | ||||
WindowsXP Professional | WindowsXP Professional 64bit Edition | |||
SuperPi | 46秒 | 45秒 | ||
L.A.M.E V3.93.1 | 94秒 | 94秒 | ||
XMPEG 5.0 | 69秒 | 70秒 | ||
Sisoft Sandra 2004 x86-32 | CPU Arithmetic | Dhrystone ALU | 8386 | 8302 |
Whetstone FPU | 3167 | 3138 | ||
Whetstone iSSE2 | 4105 | 4053 | ||
CPU Multimedia | Integer iSSE2 | 15000 | 14832 | |
Float iSSE2 | 19783 | 19588 | ||
Memory Bandwidth | Int Buffered iSSE2 | 2546 | 2515 | |
Float Buffered iSSE2 | 2546 | 2517 |
测试结果显示这些软件在32位或64位操作系统下并没有明显的性能区别,Sisoft Sandra 2004在64位系统下得分会比32位系统低一些(1%左右),这很可能是兼容模式下处理器变址寻址所带来的额外开销造成的。需要注意的是,尽管我们都知道64位程序比32位程序有更高的运行速度,但这些软件都是基于32位操作系统编程的,因此并不能发挥64位处理器的真正威力。
我们的第一次桌面64位尝试虽然算不上成功,64位平台是值得我们期待的。
总结
看过测试结果,相信大家对AMD全新的Athlon64处理器的性能已经有了一个总的印象。究竟要为Athlon64下一个什么样的评价呢?首先Athlon64的进步是值得肯定的,先进的架构设计让它在AthlonXP的基础之上取得了长足的进步,在CPU性能、内存子系统性能,图形子系统性能以及整机性能方面,Athlon64都不乏新亮点,使AMD的产品线重新上升到了Intel的同一高度。在与Intel的产品较量当中,Pentium4C的性能介于Athlon64 FX和Athlon64之间,胜负的关键在于AMD的产品策略——究竟拿什么去碰目前Pentium4。用Athlon64恐怕力不从心,用Athlon64 FX虽然可以胜出,但未来AMD又拿出什么来应付Intel的Pentium4 EE和Prescott呢?这是AMD需要认真应对的一个棘手问题。
虽然在32位领域AMD的路并不好走,但在崭新的64位领域,AMD在未来一段时间内都不会遭受狙击。AMD的64位之路将会朝什么方向走下去,64位架构是否真正可以帮助AMD迈向成功呢?这些令人关注的问题有待时间去考证。
后话——AMD64能否火一把?
在桌面64位处理器刚刚到来之际,谁也难以预料这样的产品到底会领导潮流还是最终被潮流所淹没。不少业内人士认为64位桌面平台至少要好几年后才可能成为市场主流。Intel总裁Paul Otellini就曾表示,2008年甚至2009年之前,Intel可能都不急于生产64位桌面处理器芯片,因此现在“并没有急切转向64位的必要”。但是,他也表示,Intel将努力把64位芯片的某些功能“尽早”带入桌面产品中。
不过,AMD公司的代表曾多次充满自信地在媒体面前表示:64位时代已经到来,AMD公司不会像某些厂商那样等待市场上的所有时机都成熟起来才动手,道理非常简单——没有64位处理器这个“瓶子”,作为64位计算的软件和应用的“水”永远无法到来。AMD公司的说法的确不无道理。
在目前32位和64位泾渭分明的市场环境当中,AMD Athlon64所走的是一条前人没走过的路,AMD是进入这片未被开垦的处女地的第一人,在深知前路荆棘满途的同时我们也应该看到这个市场是相当广阔的。虽然Intel声称不愿过早进入桌面64位市场,但它也绝对不愿意给对手让出一片相对宁静的生存空间。毕竟Intel在高端64位市场屡屡遭受挫折,Itanium的销量少得可怜,谁又敢保证Intel不会转战桌面64位市场与AMD来个你死我活呢?不过就目前所掌握的消息来看,Intel在短期内仍将采用静观其变的策略。虽然随着Athlon64的推出,Intel是否会在下一代Prescott处理器当中引入其x86-64 Yamhill技术早已议论纷纷,但根据最近一次的Intel官方消息,Prescott处理器将会沿用Pentium4的架构和命名,并引入SSE3指令集,而且发布时间延后到明年1-2月。也就是说,在明年2月之前,迎战Athlon64的仍然是目前的Pentium4,对抗Athlon64 Fx-51的则会是几乎同时发布的配备2MB L3缓存Pentium 4 EE处理器。Intel很显然认为AMD在短时间内难以大规模生产Athlon64,加上0.09微米Prescott在生产上也遇到一定困难,所以Intel决意将正面交锋留到明年。对于AMD而言,Prescott上市之前的这段时间绝对是推广Athlon64的绝好机会,如何在上市初期打好根基关系到Athlon64未来的发展前途。
另一方面的利好消息来自于业界的广泛支持。AMD64架构的巨大吸引力,不但引来了VIA、nVidia、SiS、ALi等众多芯片组厂商和华硕、技嘉、微星等主板大厂的鼎力相助,不少OEM厂商甚至就连一向高傲的高端服务器厂商SUN和HP也对Opteron和Athlon64流露出浓厚的兴趣。操作系统方面微软亮出了绿灯,Linux 64位系统也提供了良好的支持。
如果要问Athlon64的发展存在什么阻力的话,应用软件的支持问题虽然比较重要,但并非是最关键的。具备了良好的硬件环境和操作系统环境,相信软件厂商们并不会抗拒推出64位软件,一但软件环境得到丰富,Athlon64就好比如鱼得水。反倒是AMD的生产能力成为了Athlon64成败的一个关键因素。众所周知,供货不足的问题长期困扰着AMD,以至于虽有好的产品却得不到良好的销售收益,直接影响到产品的市场前景。这次AMD也认识到问题的严重性,将AthlonXP等产品的生产线转移到了Fab25,而让Fab30全力应付AMD64处理器的生产,加上使用已经相当成熟的0.13微米工艺,AMD64处理器的产量有望得到保证。
在众多利好因素支撑下,我们的确有理由相信Athlon 64会谱写辉煌。
相关文章
更多+相同厂商
热门推荐
点击查看更多
点击查看更多
点击查看更多
说两句网友评论