分类分类
关注+2004-10-08作者:蓝点
一、Intel技术回顾
2M L3缓存技术

图1
桌面领域首次出现了2M三级缓存的处理器
在IDF2003上发布了Pentium4(以下简称P4) Extreme Edition。11月正式上市时被更名为P4XE,中文名称为“P4至尊”。作为P4的终极版本,P4XE采用0.13微米工艺制造,主频率为3.2G,支持HT,值得注意的是P4 XE加入了2M三级缓存技术。在频率提升困难的情况下,增加缓存的容量是提高性能的捷径。特别是P4的超长流水线结构,缓存容量的增加可以减少分支预测失败后造成的效率损失。但是大容量缓存的弊端也很明显:发热量,功耗增大,对散热要求提高。

图2
可以看到,由于加入了2M的缓存,与频率相同的P4 3.2G相比,P4 XE 3.2G晶体管数目暴增,功耗也增大了10.1W。可见缓存的增加对现有的主板的供电系统是不小的考验。缓存的增加也对CPU的散热提出了更高的要求。核心最高温度下降到了64℃,散热器的热阻至少要求达到0.25℃/W,超频也更加困难。
Hyper-threading(超线程技术)

图3
HT技术第一次被引入PC是2002年11月发布的P4 3.06G,2003年P4C系列将HT技术带入了3G以下的CPU。Pentium 4是超长流水线、高主率的处理器。运行一般软件时,处理器中很多运算单元暂时闲置,浪费大量资源,而且频率越高浪费越大。HT技术的设计思想是让闲置的运算单元并行执行其他线程的运算,最大限度的利用处理器资源。因此,理论上,具备HT技术的处理器要比不具备该技术的处理器拥有更高的执行效率。HT技术在一个物理处理器核心的基础上虚拟两个逻辑处理器核心,每个逻辑处理器核心拥有独立的寄存器。两套寄存器协同处理多个线程,使处理器具备同时运行两个程序,或者是一个程序中两个线程的并行运算能力。除了处理器,HT技术的实现还需要主板BIOS,操作系统和应用软件的支持。从845PE起,Intel的芯片组均提供了HT支持。WINXP和WIN2000SP4也提供了HT支持P4 2.4C以及P4 2..6C的普及解决了HT推广的硬件方面。HT现在最需要应用软件的支持。
由于不是真正的双处理器技术,HT的应用存在一定的局限性。比如,在低频的处理器本身性能不强,没有那么多“空余”的资源可以再利用,此时采用HT技术就会拖后腿。如果出现资源不足的情况(包括内存带宽和周边设备的缺陷),HT技术开启后某些应用也会出现性能下降的情况,Intel也已经承认确实存在极少数性能下降的情况。但绝大多数应用程序的性能会有所提高,特别是使用多线程应用程序和同时运行两个应用程序时。
二、AMD技术回顾

图4
64位计算技术
AMD正在探寻一条与Intel不同的技术道路。2003年3月AMD的K8终于亮相——面向服务器的Opteron。9月份,原来代号为ClawHammer的桌面级64bit处理器Athlon 64和以及SledgeHammer的Athlon FX也与世人见面。AMD开始了64bit计算的推广之路。
AMD推广的64bit计算技术是“X86-64”。作为X86-32的延伸,AMD认为其最大的优势是对现有系统的完美兼容。通常所说的64位指令,并不是指指令的全长或操作码的长度为64位,而是指操作数所能达到的最大位数为64位。由于操作数一般需要存放在通用寄存器中,因此64位处理器通用寄存器的尺寸也必须是64位。相比传统的X86处理器,K8在进行64位扩展的时侯,把8个通用寄存器增加到了64位,同时增加了指令指针寄存器的位数为64位。
K8的架构与相比原来的Barton核心相比没有发生实质性的变化。Athlon 64和Athlon FX的强劲性能很大程度上得益于集成的内存控制器。但是12级流水线和SOI工艺可以使K8的主频继续提升。
AMD还不足以推动整个PC向64bit过渡,所以AMD将64bit计算的先进性与对现有系统的兼容性同等重视。作为推广的最终目标和现实努力,AMD希望能先于Intel之前掌握64位平台的住的主导。如果成功,AMD可能会翻身;即使推广失败,那么Athlon 64和Athlon FX仍然是性能很强的32bit处理器。
集成的内存控制器
Athlon64/ AthlonFX处理器使用了全新的北桥架构,把旧有北桥一分为二:内存控制器,北桥总线接口直接集成到了处理器内部;传统北桥中的AGP控制器,与南桥进行数据交换的接口界面则外置。新的北桥架构通过外置Hypertransport总线(最大位宽16bit,最大运行频率800MHz的双向传输)将北桥的内置部分同外置部分的AGP控制器等连接在一起。峰值带宽达到了6.4GB/s,与Intel的P4的6.4GB/s持平。
集成内存控制器是AMD的一个创举。这种结构可以最大限度的减少内存与处理器之间传递数据的延迟。Athlon64整合了单通道DDR400控制器,AthlonFX则可以支持双通道Registered DDR400内存。K8的基本结构没有发生质变,能够在比Barton更低的频率下就击败P4 3.2G,新的内存控制器功不可没。
三、2003年CPU的特点
作为PC的核心部件,CPU的升级换代引领着其他部件的升级浪潮。2003年的CPU市场依然是Intel和AMD你争我夺。整个市场依然是Intel强AMD弱。回顾2003年的CPU发展的特点还是很鲜明的。
主频提升困难
Intel在2002年底发布了P4 3.06G,到截稿时Intel发布的最高频率是P4 3.2G,一年之中频率只提升了200MHz不到。这种提升的幅度在Intel的近两年的历史上是罕见的。Athlon XP的实际频率也徘徊在2.2G左右。造成这种情况的原因可能有两个:首先是风冷条件下现有处理器的频率已经接近0.13微米工艺的极限。Intel将再次面临制造工艺的提升。不过Intel已经表示0.09微米工艺已经成熟,很快就可以投入量产。AMD的问题要大一些,K7的架构已经到了极限,由于K7采用了十级流水线设计,继续提高频率很可能造成每级流水线的负担增大。(Barton核心的Athlon XP在风冷条件下的极限频率在2.6G左右,P4则可以突破4G)
另外一个原因是处理器的功耗已经非常大了,如果继续提升主频,将增加主板的设计难度和制造成本。原本设计865/875的时候考虑了对Prescott的支持,但Prescott 100W以上的功耗使得这一想法成了悬案。即使是2.8G的Prescott都可能达到100W,只有符合fmB1.5或以上规范的主板才能支持Prescott。
前端总线提升非常明显
2003年P4的前端总线(FSB)从533 MHz提升到了800 MHz,AMD也发布了FSB为400MHz的Athlon XP,同时Athlon64也都采用了800MHz总线的设计。
总线的提升对有利于提升性能,在主频提升困难的情况下,提升总线频率是一个非常好的过渡办法。而且Intel将FSB提升到800MHz,对主板MCH芯片要求高了很多。Intel可以利用自己的制造工艺上的优势来打压台系厂商(台系厂商的北桥芯片的制造工艺与Intel比还存在一定的差距)。Intel还计划将总线频率提升至1.2G。
四、芯片组新技术的回顾
PAT技术
PAT的全称是Performance Accelerate Technology,直接的翻译是“性能加速技术”。它出现在2003年4月份发布的875P芯片组中。这种技术主要被用来改进芯片组的性能。PAT对芯片组性能的提升是通过减少了芯片组内部FSB和系统内存之间延迟来实现的。PAT技术一共减少了两个传输周期的延迟,其中从CPU到内存控制器的数据传输减少了一个时钟周期,从内存控制器到内存的片选又减少了一个时钟周期。PAT技术必须依赖芯片组和BIOS,865芯片组系列就不能实现PAT。最初普遍认为PAT是875P的独门秘籍。但是Intel宣布865PE芯片组已经预留了PAT的相关电路只是没有打开后,主板厂商便开始在865PE中打开所谓“内存加速模式”来达到和PAT同样的效果。PAT技术对提生内存带宽是非常有帮助的。只是这种技术对内存的品质提出苛刻的要求。普通的应用中用户是很难体会到PAT和类PAT技术带来的好处,所以在选择865PE主板时不必太在意是否提供了类PAT的内存加速技术。
Dual DDR
2003年Intel彻底放弃了叫好不叫座的RAMBUS,大力推广Dual DDR(双通道DDR)来满足P4的庞大内存带宽需求。Intel在年初上市了入门工作站级别的E7205芯片组,支持HT技术,533FSB和Dual DDR266。
4月23日,Intel又发布800FSB的P4处理器和支持Dual DDR400的875芯片组,后续发布的865PE/G/P均以Dual DDR为卖点。不过实现双通道需要有一些要求,比如要将两根内存分别插如同一组内存插槽内才能实现双通道,内存的批号,容量,速度也要尽可能一致。
除了Intel,Dual DDR也染指了AMD平台。nForce2的前身nForce第一次将双通道的概念引入PC。但是和Intel的Dual DDR不同,Athlon XP的FSB带宽需求单通道DDR即可满足。nForce2含有两个内存控制器,可以同时为两个设备提供数据,与以往的单个内存控制器相比,nForce2提高了多任务处理能力。也因为这个原因,nForce2组成的双通道的形式要灵活的多---不同容量和不同规格的内存都可以。这种实现方式的弊端是带宽提升就很难实现了。nForce2双通道的实际效果不如865/875就很自然了。
我们到底需要多快的CPU?
处理器发展到现在,最高主频已经突破了3GHz,达到3.2GHz,而且在不久的将来,更高主频的CPU还将陆续出现。不过越来越多的用户就会提出这样一个疑问:这么快的CPU对我来说究竟有哪些好处?难道我花几千元买到一颗3.2G的P4或者Athlon64 3200+仅仅是为了看看测试得分吗?到底在哪些方面才能真真切切的体会到这些高速处理器的优势来?
为了回答这个问题,我们就得从日常应用的角度去分析了。
视频、音频编码压缩
首先,大家买电脑都是为了使用而不是测试的,所以测试的分数只能给用户以指导,但是代替不了实际的应用。在日常的应用中,也许大家把大部分时间都用在了上网、聊天、看DVD以及玩游戏上。但是随着视频、音频技术的高速发展以及数码产品的普及,现在的应用发生了巨大的变化。下面列举几个实际应用的例子。
用户甲:最近从同学那里借来《终结者III》、《黑客帝国2》等几部DVD大片,看了之后觉得十分不错。想保存在机器上,不过由于拷贝DVD占用空间实在太大,自己又不想去再买碟,于是通过XMPEG软件来压缩转换DVD影片。可是刚一转换就发现问题了,原来的P3 700已经力不从心了,转换时间居然长达8个多小时,而且会遇到中途死机的问题。平时上网、打字都觉得这个机器速度和同学那台P4相差无几,但是现在……
用户乙:最近老爸新买了一台数码摄像机,因此出去游玩的机会增多了。每次游玩归来的时候老爸都交给我一项艰巨的任务,将DV里的东西保存在电脑上。可是DV输出到电脑上的AVI文件十分巨大,少则几百兆,多的话高达几个GB,如果不压缩的话,硬盘空间根本不够。可是每次压缩就感觉电脑慢如蜗牛,我的机器可是当时红极一时的Athlon XP 1500+呀……
上述两个案例都真实的反映出视频、音频的编码压缩对CPU速度的需求是无止境的。而且即使目前最快的Pentium43.2G也满足不了需求,明白了这个我想你就明白了为什么还要选择那么高速的CPU。
测试说明
光说不做那可不行,要反映实际性能还得通过测试来说明。为了全面的反映处理器性能,我们选择了目前主流的视频、音频编码压缩软件。
1、Main Concept Mpeg Encoder

图1
这是一个功能强大的MPEG编码软件,可以帮助你快速的将AVI文件压缩并重新编码为高品质的MPEG视频文件,压缩速度很快,支持批处理操作,支持将多个MPEG文件合并为一个MPEG文件,程序界面友好,操作非常简单。我们测试是一个5分26秒(31.7MB)的AVI文件,参数设置为“720×540,25FPS,PAL”。
2、Xmpeg+Divx 5.02

图2
XMPEG是FlaskMPEG的修改版,是一款优秀的DVD编码工具。Lang目录下chinese.lang.Xmpeg为中文语言包,只要把其它语言文件移除即可显示中文。除了支持MPEG2的解压缩之外,稳定性也高一些,在编码中的处理功能还是很强大的。我们测试的是一个2分6秒(107MB)的VOB文件,参数设置为“720×480,29.97FPS,NTSC”,其他为默认设置。
3、Windows Media Encoder9

图3
这是一套容易使用,而且功能强大的软件,提供使用者自行录制影像的功能,可以从影像捕捉设备或桌面画面录制,亦提供文件格式转换的功能。主要的特色在于容易使用、高品质编码、增强的可程序化与管理。特点为:新的使用者界面和向导,更容易设定与制作影片,用来提供网络现场播放或需求播放,并支持多重来源,可以立即切换来源,并可监视编码程序进行时的资料,如影像大小、资料流量等等。新的编码能力,支持de-interlacing、inverse telecine和屏幕捕捉,能有更好的输出品质,能从320×240×60fps到640×480×30fps,捕捉文件最大可到30GB,支持的捕捉设备包括Winnov、ATI、Hauppauge,以及USB视讯摄影机等。Windows Media Encoder SDK提供网站开发者全自动的编码控制,可从网络(LAN)远端控制,或透过API存取或ASP控制。我们测试是一个2分6秒(13.7MB)的AVI文件,参数设置为“DVD质量视频(1Mbps VBR峰值),640×480”。
4、TMPG Encoder 2.59

图4
TMPGEnc是日本人堀浩行开发的一套MPEG编码/工具软件,支持VCD、SVCD、DVD等各种格式。该软件不光生成的MPEG文件的图象质量非常好,而且还是免费软件(注,Plus版本是收费的)。我们测试的是一个26.6MB的文件,参数选择为“Non-interlace,4:3,625line(PAL,704×576)”。
5、Lame 3.93

图5
这是一个非常著名的HIFI级mp3制作工具,可以说是MP3历史上革命性的东西。MP3最受争议的就是音质问题,其高频损失很大,很多mp3编码器粗糙的编码算法不但导致高频丢失,还丢失了许多细节。Lame具有动态压缩的特点,可以尽可能的保持音质的纯正。我们测试的是一个669MB的WAV文件,参数设置为“-b320 -h -q 0”。
6、Real9编码压缩

图6
本软件可以实现多媒体文件的大比例压缩,使你的硬盘成为海量多媒体库。同时,本软件具有输出文件大小预算功能,让用户未压缩先知道其预计输出大小,为控制其大小可调节音频或总压缩速率选项。精确的剩余时间计算功能,让用户可以预知其剩余压缩时间。我们测试的是一个4分21秒(163MB)的MPG文件,参数设置为默认。
由于时间关系,我们不可能测试更多的软件,不过以上各软件可以代表目前市面上主流的编码压缩软件。
测试平台:
CPU:
Pentium4 XE3.2G(200×16/2M三级缓存)
Pentium43.2G(200×16/HT)
Pentium4 2.6C(200×13/HT)
Pentium4 2.4B(133×18)
Celeron3.2G(133×24)
Celeron2.4G(100×24)
Athlon64 3200+(200×10)
AthlonXP 3200+(200×11/Barton)
AthlonXP 2700+(166×13/Thoroughbred)
AthlonXP 2500+(166×11/Barton)
AthlonXP 1700+(133×11/Thoroughbred)
Duron2.0G(200×10)
Duron 1.6G (133×12)
内存:
Kingston DDR400 256MB×2(内存参数:2.5-8-3-3)
显卡:
GeForce FX 5900标准版(Forceware 52.16版)
硬盘:
希捷7200.7 80G
主板:
青云Albatron 865PE ProII(865PE芯片组,Pentium4、Celeron平台)
华硕A7N8X 2.0(nForce2芯片组,AthlonXP、Duron平台)
联想K8V800(K8T800芯片组,Athlon64平台)
操作系统:
WinXP+SP1+DX9.0b
测试中我们共使用了多达13种组合的CPU频率,不同的玩家可以对号入座,若型号不在列举范围之内,则可以选择频率比较接近的CPU频率作成绩参考。
2003年最受关注的CPU
一、性能之王
今年Intel和AMD发布的最强劲的面向PC的CPU都定位在3200这个数字上。AMD抢先发布了PR值为3200的AthlonXP处理器。Intel自然不会放手让频率之王被AMD夺得。6月23日,Intel正式推出第五款800FSB的P4,也是频率最高的——P4 3.2G。
3个月之后,AMD再次出马,发布了其跨时代的产品——K8,其中包括了面向主流市场的Athlon64 3200+。

图1
Pentium4 3.2G

图2
作为对AthlonXP 3200+的回应,6月23日Intel正式发布了最新的3.2G Pentium 4处理器,为800MHz前端总线版本的Pentium 4家族再添一丁,刷新了x86处理器的频率新纪录。至截稿时Intel没有发布更高频的P4处理器。Pentium 4 3.2G也将成为今年的P4性能之王。Intel对AMD的绝对频率优势也将继续下去。3.2GHz的Pentium 4处理器的核心电压为1.550V,与3.0GHz Pentium 4一样;设计功耗为82.0W,与3.0GHz Pentium 4的81.9W相比只增加了0.1W,看来Intel在对功耗的控制方面是相当令人满意的(依然是个惊人的数字)。
Athlon64 3200+

图3
身为AMD K8家族的一员,Athlon64 3200+是对抗P4的最重要武器,与同门师兄Athlon FX不同,内置1MB二级缓存,内置的内存控制器仅支持内存单通道,新增对SSE2以及X86-64指令集的支持。Athlon64使用了较新的C0制程,而早期的Opteron使用的是B3制程。新的制程也提升了Athlon64的超频性能。支持单通道的Athlon64平台,至多只能支持3条普通Unbuffered内存。当需要使用4条内存条时,就必须使用Registed内存。作为Intel和AMD的旗舰产品,他们的品质不容质疑。他们也是0.13µm工艺的颠峰之做。
二、超频极品:
Pentium4 2.4C

图4
每一款P4 2.4都有超频极品诞生,400FSB有编号SL6GS,533FSB有SL6EF,P4 2.4C有SL6WF。从整体的超频幅度看,P4 2.4C是最出色的。因为P4 2.4C采用的是D1核心,相比C1核心的P4,整体品质有了很大的提高。几乎所有的P4 2.4C都可以超越3G。一般的导致P4 2.4C超频失败最可能的原因在于主板和内存的设置。P4 2.4C的倍频是12,要达到3G,那么MCH的频率就要到250MHz。能提供这么高的频率的主板一般都价格不菲。这也是低倍频CPU超频的最大弱点。此外还要注意内存设置,如果设成同步的话,后果不堪设想。所以超频的时候要将FSB:DRAM设成3:2或者5:4
目前P4 2.4C的风冷超频极限在3.8—3.9G左右。超到3.4G以上的可能性不低。选择P4 2.4C还因为它是支持HT技术中的P4中最便宜的。HT是一样非常有用的技术,虽然现在还不能通过测试软件进行量化,但是未来的前景还是很好的。当超频到3G以后,HT的效果更加明显。
我们找了国内和国外两款属于极品的P4 2.4C的超频记录:
Intel P4 Northwood 2.4CGhz (D1 Stepping)

图5
AthlonXP1700+

图6
Athlon XP1700+是Thoroughbred B核心的XP中的频率最低的型号。AMD制造工艺的进步使Thoroughbred B核心相比Thoroughbred A核心品质提高了不少。而且Athlon XP1700+的超频能力随着电压的提升而增强。加电压之后Athlon XP1700+至少可以上2400+(2.0G),超到2600+和2800+的概率也比较高,挑选Athlon XP1700+要特别注意编号。
AthlonXP 2500+

图7
超频极品有一个共同点:它们都是同系列中频率最低的。虽然它们的绝对超频记录不如高频CPU,但是超频幅度和价格的优势使它们成为超频极品。Athlon XP 2500+是Barton核心的最低型号,由于增加了256K L2 Cache,超频后的性能提升明显。Athlon XP 2500+大多可以超到3200+的频率(2.2G);体质更好的可以在风冷条件下达到2.3--2.4G的频率。受到0.13微米极限的限制,要继续提高一般需要采用液冷的方式。需要注意的是在超频Athlon XP系列要选择好的内存。
三、另类产品
Pentium 4XE

图8
从本次测试来看,P4 XE应该算上目前桌面处理器上的性能之王,不过考虑到它的本身特点,我们这里将它归类为另类产品。说它另类是因为它比普通的P4多出了2MB的三级缓存。由于Intel意识到现有的P4在性能方面很难与Athlon64/ AthlonFX抗衡。在频率提升困难,Prescott延期的情况下,加大缓存容量来增强处理器的游戏的性能不失为捷径。和Athlon FX与Opteron的关系一样,P4XE也是由面向服务器的Xeno简化而来。昂贵也是P4XE的特征之一:OEM的每千颗单价达到了740美元,零售价格达到900美元(国内报价为8900元)。
Applebred和Thorton

图9
新Duron 1.6G

图10
Thorton核心AthlonXP 2000+
这两款产品也与CPU的缓存有关。为了填补老Duron和Athlon XP1700+/1800+的停产形成的低端市场上的真空,AMD发布了采用Applebred核心的Duron处理器和Thorton核心的Athlon XP处理器。Applebred核心的Duron处理器是屏蔽掉192K L2 Cache的Thoroughbred-B核心的XP处理器。与P4 Celeron相比,新Duron的性能优势和价格优势明显。新Duron还有一个卖点便是可以通过连通L2金桥打开被屏蔽的192K缓存,修改成功之后新Duron就摇身变成了Thoroughbred核心的Athlon XP了。
Thorton是由Barton简化而来的,L2 Cache从Barton的512K减至256K,因此Thorton也有改造的潜力。方法与新Duron一样。Thorton的起跳频率为2000+(1.667G),不久又发布了2400+(2.0G)。Thorton的品质普遍不错,大多可以超到2G以上。
相关文章
更多+相同厂商
热门推荐
点击查看更多
点击查看更多
点击查看更多
说两句网友评论