沙场秋点兵——CPU篇 - 电脑 - 曾成

(这条文章已经被阅读了 44 次) 时间:2001-02-24 23:46:33 来源:曾成 (曾成) 原创-IT

2000年的硬件技术发展,毫无疑问贯穿着CPU厂商纷争这条主线,AMD公司的Athlon处理器异军突起,不仅打破了Intel公司一统天下的梦想,而且首次在主频速度上超过了主流的PentiumⅢ处理器。随着Intel与AMD竞争的加剧,CPU换代时间开始变快。CPU的性能发展除了更新CPU架构以外,主要得益于芯片制造技术的发展。在2000年CPU生产工艺的改进对CPU性能的提高有着很大的影响。目前生产CPU主要采用铝导线连接工艺,铜导线连接工艺比铝导线连接工艺生产的CPU速度快得多;另外由于铜比铝的导电性能好,CPU的功耗会进一步下降。AMD、Intel均采用铜导线连接工艺生产下一代CPU。CPU体积小,功耗大,最新的芯片封装工艺已能提供接近1:1的封装,薄而小的封装为散热提供了良好的条件。由于现有技术已能将大容量全速二级缓存内置于处理器芯片中,笨重的Slot卡盒显得很累赘,Intel和AMD均使其一部分CPU重返Socket架构。大型绝缘硅圆片制作技术的产生,也为在CPU中集成更多的晶体管、更多的Cache提供了条件,同时,也是整合各种功能的物质基础。随着CPU厂商将显示芯片加入CPU中,整合的热潮将进一步掀起,成本进一步降低。总的来说,2000年CPU厂商将不断更新CPU架构,不断地给我们带来性能更强、速度更快、价格更低的CPU。在本文,就让我们看看2000年带给我们全新感觉主流CPU都有些哪些? CPU厂商又有些什么动作呢?

Intel

首先,先说明一下INTEL最近一年的尴尬的事情。INTEL在这一年中可谓是背运之极。先是PENTIUM3的性能公认不如K7.。而且连INTEL一直引以为豪的浮点运算能力也一败涂地。接下来,820主板又给INTEL惹来了一身的祸。820主板由于在MTH上的毛病,最后怎么卖出去就要怎么在买回来。由于RDRAM高高在上的价格,性能的小幅度的提升竟然会被VIA的旁门左到——PC133击败。为应付AMD的1G Hz速龙处理器,仓促推出的1.13G PⅢ Coppermine因为自身的问题,竟被称作铜渣。而现在INTEL的CELERON2更是在风光了2个月后,就被DURON完全压制住了。不过,INTEL815主板现在反应很好,有可能给INTEL带走一些霉气。

Intel的王牌——PentiumⅢ

英特尔(Intel)的奔腾(Pentium)III上市一年了,并且已经得到改进:去年秋天,英特尔推出了Coppermine核心,配有256K字节管芯片与全速的二级缓存,能与Katmai的512K字节外部半速L2缓存较量。该款“高级传输缓存”被融入CPU的硅版(管芯)中,可支持与处理器核心的256位数据连接,这再一次优于Katmai外部L2缓存的64位宽接口。配有Katmai核心的奔腾III在不能在时钟方面与AMD的Athlon处理器相抗衡的时候,而Coppermine-PIII可以从集成缓存中获得足够快的速度,从而与Athlon一比高下。Coppermine L2缓存的集成之所以成为可能是因为该款芯片以0.18微米工艺制造而成,这减小了Katmai核心的管芯大小,使得L2缓存能够装入同一个管芯内。Katmai是以0.25微米工艺制成的。
  既然奔腾III不再需要外部L2缓存模式了,那么英特尔就可以供应PIII的socket版本了,现在称为“FCPGA”,全称“触发芯片管脚网格阵列”。 虽然英特尔想摒弃奔腾III较大且较昂贵的Slot1版本,但是你现在仍然可以获得两种版本带Coppermine核心的奔腾III。让我们迅速看一下这两个不同的奔腾III核心版本:Katmai与Coppermine。

Katmai (Pentium III) Coppermine (Pentium IIIE)
Clock Speeds at 100 MHz FSB 450, 500, 550, 600 MHz 550E, 600E, 650, 700, 750, 800, 850 MHz
Clock Speeds at 133 MHz(“B”) 533B, 600B MHz 533EB, 600EB, 667, 733, 800EB, 866, 1000 MHz
L2 Cache 512 KByte 256 KByte
L2 Cache Interface 64 Bit 256 Bit
L2 Clock Speed Half CPU Speed Full CPU speed
L2 Associativity 4-way set 8-way set
CPU Voltage 2.0V 1.65V (1.7V at 1 GHz)
  

“老” PentiumⅢ

 在右侧你可以看到“老式”奔腾III的两个缓存芯片。

PentiumⅢ处理器正是Intel现在主推的高档处理器产品。比较“老” 的PentiumⅢ采用0.25微米的制造工艺,采用的是“Katmai”的内核,沿用了PentiumⅡ处理器的Slot 1架构,但是Intel为PentiumⅢ设计了新的SECC2接口。PentiumⅢ处理器内置了32KB一级缓存和512KB运行速度为芯片核心速度一半的二级缓存,支持MMX多媒体指令集,在此基础上,Intel还为PentiumⅢ处理器增加自己的70条“3D”指令——SSE(Streaming SIMD Extensions),SEE指令集主要用于提高PentiumⅢ在三维处理与浮点方面的性能,这也使得PentiumⅢ在处理图形与图像的时候更加得心应手。并且SEE指令集也可以让原来支持MMX多媒体指令集的软件和Web开发程序运行得更快。SEE指令集对视频加速也能起到很大的作用。PentiumⅢ刚上市时有450MHz和500MHz两种规格,其系统总线频率为100MHz。

PIII Coppermine

  而新上市的PentiumⅢ处理器(代号“Coppermine”,它也有个中文名字——“铜矿”。如果你单从名字上来判断这种处理器的金属层采用了IBM的铜导线技术那就大错特错了,其实Coppermine金属层采用的技术仍然是铝导线技术。此外,带Katmai核心的奔腾III在名字中没有字母“E”,而为133 MHz外频设计的奔腾III在名字中有字母“B”!正如你在表格中所见,Coppermine具有几个优点:

降低核心电压可以减少耗电量,这样Coppermine能够以较低温度运行。
0.18微米工艺可以制造出比0.25微米Katmai更小的管芯,这样可以降低成本,增加产量。
Coppermine全速L2缓存可以使芯片的性能超出Katmai近10%。
优化过的缓存执行时间与加强的缓存结合性可以通过使用256位宽L2缓存总线提供更好的性能。
Coppermine更适于超频。Katmai的缓存芯片不能承受超过300 MHz (600 MHz核心速度)的频率,而多数Coppermine核心可以承受至少650 MHz的频率。

  尽管现在处于AMD强大攻势下,但是英特尔的奔腾III仍然是最受欢迎的处理器。同时,AMD的Athlon正在逐步地窃取这块巨型蛋糕的一小部分。随着Thunderbird(雷鸟)与Spitfire(烈火)的推出,我想奔腾III的价格会大幅下降的。
如果你想购买奔腾III处理器的话:现在很容易就可以花钱了。现在考虑你的真正需求更加重要。我认为,100 MHz型号在今天已经过时了,因为它们不能支持133 MHz的同类产品。多数使用VIA Apollo Pro 133A芯片组的主板可以轻易地重置总线速度。使用100 MHz SDRAM的133 MHz CPU不成问题。你可以在使用PC133存储器的同时运行100 MHz FSB处理器。
  如果的想超频的话,应该获得型号为500E、533E、550E、600E、600EB、667EB或733EB 的奔腾III处理器。时钟速度越快,那么超频造成的不稳定危险也越高。只要英特尔难以供应足够的高端处理器,那么我就不指望其CPU有多大的超频空间(特别是中间的型号733与800 MHz)。当然我们不能忘记英特尔的赛扬Ⅱ处理器。

低端市场的领头羊——赛扬

  前不久INTEL为反击AMD和威盛的紧逼,又推出了基于0.18微米制造工艺的新赛扬(Celeron II)。首批规格包括:Celeron566和Celeron600,以下是Celeron566和Celeron600的基本特性:

  0.18微米工艺制造

  总线频率为66MHz

  1.5V核心工作电压

  128KB ECC(Error Correcting Code)全速On-die(芯片内建)L2 Cache

  Coppermine核心

  为了避免投资重新设计CPU核心,Intel利用了Coppermine的核心。但在L2 Cache上Celeron Ⅱ与Coppermine:Celeron II并未采用Intel为Coppermine设计的ATC(Adanceed Transfer Cach)高级传输L2 Cache。

  我们知道以前的Celeron系列(从Celeron 300A开始)和PⅡ和早期的PⅢ相比有一大优势,即其L2 Cache采用了集成在芯片内部的方式,而P II和早期的PⅢ的L2 Cache则是在芯片外的CPU PCB板上的,它只能以1/2的核心频率工作。这样Celeron系列L2 Cache的传输效率较高,这就是Celeron芯片只有128KB片内Cache,但性能却几乎超过同频PⅡ的重要原因。从架构上说,Coppermine与Althon相比,只能算是个老古董,但正因为Coppermine采用了使用ATC技术的L2 片内Cache,使得Coppermine具有了和Althon这一当前最优秀的32位处理器相抗衡的实力(同频的Coppermine能够击败采用了512KB L2 Cache的Katmai)。ATC是Coppermine中采用的一项新技术,使Coppermine拥有一条256位的数据通道直接连接到CPU核心部分,是Katmai 64位带宽的4倍。此外,L2 Cache采用了8路联合控制工作方式,拥有比Katmai少四分之三的Cache等待潜伏时间。ATC的主要特性如下:

  通道带宽:288-bit(256 Date,32 for ECC);

  基本架构:8路联合控制;

  Cache运行方式:写回式(2个周期时间)

  Cache数据带宽:以它32B的长度来说,当核心速度为733MHz时,每两个时钟周期,相当于11.7GB/s的传输量;

  物理地址空间:36位;

  Cache延迟时间:为原先Katmai处理器的1/4。Cache的频率和处理器核心运算单元相同。

  这次面向低端市场的CeleronⅡ继承了Celeron系列的传统,将Coppermine的片内L2 Cache容量减少一半,采用了和其前辈容量相同的128KB片内L2 Cache。和Coppermine一样其L2 Cache采用了ATC技术,但其L2 Cache的容量较Coppermine少了一半。但CeleronⅡ是针对低端市场的CPU,而游戏对CPU的Cache依赖性不是很大,因此CeleronⅡ将和以前的Celeron一样在游戏软件上将有出色的表现,而在大量的商业应用程序中表现出来的性能将大打折扣。

  以前的Celeron系列是采用0.25微米工艺制造的,CeleronⅡ采用了和PⅢ Coppermine一样的0.18微米制造工艺。这使得CeleronⅡ的功耗更少,可以工作在更高功率上。CeleronⅡ600的功耗为18W,这低于除Celeron266外的所有Celeron芯片(例如Celeron 566所需功耗为28.3W,而Celeron 400的功耗也达到23.7W)。CeleronⅡ的核心工作电压为1.5V低于Celeron的2.0V甚至比PⅢCoppermine的核心工作电压都低,这些都保证了CeleronⅡ工作时核心温度保持在相对较低的范围内。同时CeleronⅡ采用了FC-PGA的封装形式,改善了散热效果。SSE(数据流单指令多扩展指令集)是Intel公司在PⅢ处理器上增加的70条用于增强浮点运算和多媒体性能的新指令,是对MMX指令的扩展和改进,它的引入使CPU的浮点运算能力大增。在CeleronⅡ中加入SSE指令集,使的其具备了和低频PⅢ相抗衡的实力。

  66MHz的总线频率

  对于CeleronⅡ采用66MHz的总线频率,许多人都感到疑惑。真不知Intel是怎么想的。在以前的游戏程序中,3D游戏尚无法将66MHz与100MHz总线频率的性能差异充分表现出来,对于低端的Celeron系列CPU采用66MHz的总线频率是可以理解的。但现在随着细节度更高的QuakeⅢ等的推出,对系统的数据传输率提出了更高的要求。而在这种背景下,CeleronⅡ却仍然采用了66MHz的总线频率,就叫人有点难以理解了。虽然在66MHz系统频率下AGP的频率仍为66MHz,PCI的频率仍为33MHz,但芯片和其它部件的传输速率将会随着FSB的提高而得到,CPU和内存间的数据传输率也会提高,这对提高商业软件和3D游戏的运行速度都是致关重要的。采用低总线频率带来的另一个弊端在于,由于内频和外频的差距太大,使的CeleronⅡ采用了很高的倍频系数:CeleronⅡ566的倍频系数为8.5,而CeleronⅡ600更是达到了9,这超过了目前一些主板最高8X的倍频设置)。这给超频带来了一定的麻烦,您也许已经注意到,一般来讲一个系列CPU中超频能力最强的是其第一款CPU。这主要是因为其较低的倍频系数,在外频提升相同时,低倍贫系数的CPU的核心工作频率提升叫高倍频系数的CPU低,也就意味着提升CPU内频的最小单位较小,超频灵活性较高,这就有利于发挥CPU最大的超频潜能。例如对于CeleronⅡ600,在外频由66MHz提升到75MHz时,内频将提升75MHz。因此CeleronⅡ的超频灵活性受到一定的限制。

  超频能力

  Celeron II采用PIII Coppermine(铜矿)的核心,核心电压和功耗极低、工作时核心温度也较低,使它具有相当的超频潜力,但由于它仍采用66MHZ的总线频率、倍频高达9倍以上,超频起来就有些别扭,例如如果采用100MHZ外频,Celeron 566就要跑850(100×8.5),Celeron600得跑900,实践中前种超频,成功率只有一半,而且一定需要加压才能成功,600超900成功机率不会超过5%,不过采用75/83/90/95/97等低于100MHZ的外频来超频,超频的成功率就会很高,当然您的主板要有这些外频才行。Celeron II和PIII Coppermine的性能差距还是较大的,不象赛扬A与PII那样性能相近,因为Coppermine也采用内建的L2 CACHE、并在容量上多CeleronII两倍,看来赛扬A猛揍PII的现象不会再发生了。虽然Celeron II的性能比不上Coppermine,但价格非常便宜是它的一大优势,如果对超频要求不高还是值得购买的。

AMD

我还记得当初1998年微处理器论坛会上AMD首次展示的“K7方略”。在这方略上,我们可以看到了几种未来的“K7”CPU(那时候“尚未命名”)。 “K7”规格现在还耳熟能响,印象十分深刻。 我当时就预计该CPU的推出肯定会给英特尔施加压力的。 不过,很多人都不相信AMD最终能够推出一款真正威胁到英特尔垄断地位的产品。因此很少有人在意过特别的“K7”版本,而AMD已打算以此版本作为他们将来低成本的解决方案。再看AMD最近的发展,就感觉要比INTEL要好得多。这两年中AMD的CPU受到了各方面的好评。特别是在得到VIA的支持。AMD的CPU的能力得到了完全的发挥。对于AMD公司来说,推出Athlon(速龙)处理器应该是其成长业绩的一个里程碑。因为它不但重振了衰落的芯片业务,而且在质量、速度上更能力压老大哥Intel。正当Athlon气势旺盛之时,AMD公司加快推出第二代的Athlon处理器,名为Thunderbird(雷鸟)。另外,以Thunderbird架构为基础的低端处理器Duron(毒龙)也推向市场。AMD的DURON更是在K6-2后的又一款超高性价比的产品。

成熟稳定——Athlon

低端处理器之首选——Duron

 
芯片简介

  Duron采用0.18微米制程技术。为降低制造成本,Duron重新使用插座式设计(SocketA架构),放弃原来Athlon的Slot A。

  另外,AMD还引用了Intel的处理器策略,将Thunderbird上的二级缓存(L2 Cache)减少,成为Duron处理器,情况就如Intel的Pentium III及Celeron的关系一样。与Thunderbird比较,Duron芯片上的L2 Cache减少到64K,只有Thunderbird的四份之一。Duron的L1和L2 Cache均采用的是全速Cache技术,运行速度与处理器核心同速,效能跟Thunderbird一样强大。此外,由于Duron芯片内的L2 Cache较小,芯片面积(die size)只有100mm。它耗用的电压及所产生的热量相对较少,电压只需1.5V,用户无须担心热量过高,影响系统的稳定性。

  高速外频

  Duron处理器的市场策略与Celeron有所不同。因为Celeron虽然跟Pentium III是同一架构,但Intel公司刻意将Celeron的外频降到66MHz。相反,Duron的外频并没有被降低,它采用与Thunderbird相同的外频,速度为200MHz。所以单从架构上看,Duron与Thunderbird的分别就只是Cache的容量大小而已,这点无疑比Celeron更具竞争实力(特别受超频玩家的欢迎)。

  低价策略

  由于Duron芯片的体积较小,加上制造成本得到控制,Duron的市场售价有极的竞争力。价格略低于同频的CⅡ。

越级挑战Pentium III

  Duron具有200MHz外频的优势,比Celeron速度快三倍以上,跟Pentium III比较也快1.5倍。高速的外频无疑对整体运算能力有正面的影响。经测试,Duron 700MHz的整体效能竟然达到Thunderbird 700MHz的80%-90%。它的表现不但超越对手Celeron,而效能更直逼Pentium III 667MHz。在同一测试平台(相同的显示卡、硬盘及内存),Duron 700MHz的测试分数只比Pentium III 667MHz慢10-20%左右。不过,两者的售价差距则有40-50%之多,因此,Duron具有极高的性价比(Price to Performance Ratio),是低端处理器的不二之选,值得向用户推荐。

Duron与赛扬比较

英特尔赛扬 AMD Duron
总线时钟 66 MHz 200 MHz (DDR)
L1-缓存大小 16 kB I + 16 kB D = 32 kB L1-缓存 64 kB I + 64 kB D = 128 kB L1-缓存
L2-缓存大小 128 kB 64 kB
L2-缓存接口 256位 64位
平台 Socket370 Socket462
芯片组 440LX/EX/BX/ZX, 810, 815 VIA Apollo KT133, AMD750, 760
性能 相同时钟频率下奔腾III的60-80% 相同时钟频率Athlon/Thunderbird 的90%, 相同时钟频标准Athlon 的92 – 99%

你可以发现Duron的性能更接近AMD的其它产品而不是赛扬,因为AMD在Duron与Athlon上使用了相同的总线时钟。英特尔使用FSB限制的小伎俩使人们落入MHz的陷阱。没有经验的用户会以为赛扬700与奔腾III 700一样快哩。两款处理器的售价相同,但是赛扬却慢了很多。  赛扬的最大优点在于有大量的平台适用于它。英特尔赛扬的设计已有几年了,而且赛扬几乎可以在任何一个英特尔发布的平台上运行。Duron现在只能在VIA的Apollo KT133芯片组上运行,与其大哥Thunderbird一样。要等到市场上有足够的KT133平台还需要一段的时间。现在,KT133平台还难以买到。今年稍后一段时间内,VIA会为Socket462处理器与AMD推出更多的芯片组,而且Ali与SiS也会提供他们的解决方案。

毫无疑问,我要感谢AMD让我们能够购买到低价的x86处理器。Duron秉承了Athlon的特点,所以Duron可以表现上佳,甚至接近于高端CPU。英特尔的赛扬被打得溃不成军。要不是赛扬有着出色的超频记录,该款英特尔处理早就被淘汰了。
  Duron现在只有一个问题:适用它平台的供应情况。VIA才刚推出KT133芯片,而且人们已经大量需求用于Thunderbird系统。一旦KT133平台的芯片大量上市,或者AMD推出其自己的760芯片组, 人们会需求大量Duron用于中低档的系统。
  英特尔赛扬的末期指日可待了。我个人还是挺喜欢赛扬566的,因为在多数情况下它都可以超频至800 MHz。除此之外,Duron会袭卷低成本市场,除非VIA的新款 Cyrix III也达到这一性能。赛扬是死定了。

性能超群——Thunderbird Athlon

作为Athlon处理器的替代产品,AMD代号为Thunderbird的CPU一直受到业界和用户的密切关注。无论是谁都在热切的期待能够率先一睹其芳容。终于,AMD公司于6月5日,在中国台北举行的Computex 2000大展上正式发布了Thunderbird处理器。并在展会上表示:新款Athlon处理器(Thunderbird)将会同时推出Socket A与Slot A两种不同的版本,速度将包含750MHz、800MHz、850MHz、900MHz、950MHz、1GHz等,总计共有12种型式可供选择。AMD一次推出如此多的CPU型号不说绝后,起码也是空前的。AMD源何对Thunderbird如此青睐呢?现在,不妨就让我们一起来揭开它的神秘面纱吧!

Thunderbird的规格
  现在AMD成功地将256KB管芯与全速L2缓存装上了Athlon核心,上面也已经讨论过了。新款核心起了一个很恰当的名字“雷鸟”,但是实际产品会仿效英特尔奔腾III的例子,从Katmai与Coppermine过渡来。“Thunderbird”仍作为“Athlon处理器”出售,但是很容易就能区别“新”款与“旧”款之间的差异,因为“Thunderbird-Athlon”使用“SocketA”版本,而“老式-Athlon”自然仍只能使用“SlotA”了。
  我尽量在一张小表格中总结Thunderbird 与前任芯片间的差别。如果两款芯片规格相同,则该规格不予以列出。
“老式”Athlon “Thunderbird”Athlon
制造工艺 0.25 / 0.18 微米,铝制互连 0.18 微米,铝制 / 铜制 互连
管芯大小 102 mm2 (.18 微米) 117 mm2
晶体管/管芯的数量 22,000,000 37,000,000
电压 1.6 – 1.8 V 1.7 V
1 GHz下的热功率 65 W 54 W
1 GHz下的最大电流 37 A 33.6 A
L2-缓存位置 外部 管芯
L2-缓存时钟 核心时钟的33 / 40 / 50 % 核心时钟100%
L2缓存大小 512 kB 256 kB
L2缓存数据通路 64位宽 64位宽
L2缓存结构 2通道设置结合 16通道设置结合
封装 SlotA 盒 SocketA “CPGA”SlotA 盒 (仅OEM)
芯片组 AMD 750AMD 760VIA Apollo KX133 AMD 750AMD 760VIA Apollo KX133 (稳定性有问题)VIA Apollo KT133

  你可以发现Thunderbird还是需要大量的功率与电流,所以那些希望Thunderbird不像“老式”Athlon那么耗电的人可能会有所失望。你还可以发现有两种版本的Thunderbird。一个使用铝制互连,会在奥斯丁(Austin)的Fab25生产,另一个使用现代铜制互连工艺,会在德累斯顿(Dresden)的Fab30生产。现在除了两款在颜色上有区别外,其它的差异就不得而知。通过铝制互连的芯片似乎有一层绿色光泽,而铜制芯片看上去有些蓝色。

封装形式

SlotA

Thunderbird的SlotA版本严格来讲不向零售渠道出售,只推向有选择的OEM客户。

 你可以发现SlotA-Thunderbird看上去与其过去的同类产品类似,尽管缺少了L2缓存芯片。金指设备的运作情况不变。

SocketA

 Thunderbird的新socket中,管脚不少于462个,因此与英特尔处理器使用的Socket370大为不同。

Socket A

Socket370
  目前,SocketA只得到AMD老式但又良好的750芯片组与VIA(威盛)新更名的Apollo KT133芯片组的支持。
“Athlon不错,但是新款Athlon更好。”

这是总结AMD新款Thunderbird处理器最好的一句话。新集成的L2缓存可以将Athlon的性能推进到一个新的水准,使其能够在几乎所有的基准上(不仅仅是单方面对英特尔ISSE指令进行增强)与英特尔的奔腾III相抗衡。Thunderbird引人的定价可以确保Athlon CPU 继续取得成功。但是,那些希望Thunderbird远远超出Coppermine的人会有所失望。如果Athlon准备与英特尔即将推出的“Willamette”处理器比试高低的话,AMD还有许多工作要做。
Thunderbird有一个坏消息,那就是现在Athlon系统的用户在升级到新款AMD-CPU 会遇到问题。Thunderbird在零售市场上只以SocketA版本推出,而且它似乎需要新款主板。我们还得看一下是否真的无法使用SocketA至SlotA转换卡,因为这些产品正在陆续上市。 但是,AMD转用Athlon的socket版本的确是件正确的做法,而且那些有兴趣购买新款Athlon系统的人可以节省下从SocketA上的系统成本。由于“Duron”-- 仅带64KB管芯L2缓存的Thunderbird小兄弟――现已推出,AMD正在为该款新芯片的用户提供直接的升级方法。Duron也使用SocketA,这样很容易被Thunderbird取代。  由于英特尔正努力供应足够的800 MHz 以上性能的奔腾III处理器,所以Thunderbird处理器价格合理的话,AMD可以填补这一空缺。在过去半年中,AMD证明了他们可以满足人们对Athlon处理器的需求,这比英特尔奔腾III的供货强多了,因此我们可以对Thunderbird抱以同样的期盼。
  最后,还有一个平台问题。带VIA Apollo KT133芯片组的SocketA 主板即将推出,而且现在已经出现了更好的Athlon平台解决方案。VIA的KT133只是带SocketA支持的KX133,并支持AGP4x与ATA66,但是只有PC133存储器支持。AMD的760芯片组以及VIA下一款Athlon芯片组KZ266都会支持DDR-SDRAM与ATA100,因此会为新款Thunderbird与Duron处理器提供更快的平台。请你在购买首款KT133平台时记住这一点。
总之, Thunderbird通过其改进的性能与诱人的定价可以在x86处理器市场上攫取更大的份额。英特尔可能会比预计更早地降低奔腾III处理器的价格,直到最后的“Willamette”重燃性能大战。

VIA/CYRIX

台湾的VIA技术在今年的芯片组行业中迅猛发展,通过自身的规划,很可以将英特尔永居市场的头把交椅夺过来。我们对VIA在CPU行业上的兴趣讨论得较少。去年六月底VIA收购了,而恰在一年前,8月4日收购了IDT的Centaur处理器设计子机构。在实施了这些大举措后,VIA开始大踏步地加入CPU市场。

效率高管芯小耗电低——CIRIX Ⅲ

如今在低端处理器市场,在Intel 的Celeron II处理器同AMD的Duron处理器针锋相对的时候,威盛公司也同步推出了面向低端处理器市场的最新Cyrix III处理器。其实早在今年二月份,威盛就推出了自己的处理器Cyrix III,此款处理器采用的是Joshua核心,但它的主频太低,兼容性较差,整体性能不近人意。现在威盛已放弃Joshua处理器的研发,而力推采用WinChip核心的Samuel处理器,而此款处理器仍然定名为Cyrix III。

结构特点

  Via-Centaur的新款Cyrix III,亦称Samuel是一款效率高、管芯小、耗电低的CPU。Samuel现在以0.18微米工艺制造,而且管芯奇迹般地只有76平方毫米大小,比英特尔与AMD微处理器的管芯小25%。这一款小型芯片耗电小于10瓦,比新款奔腾III与Athlon耗电少得多了――这些芯片的耗电量会是三至六倍之多。耗电少使得Samuel在Internet设备与移动设备中倍受瞩目。VIA还声明Samuel可以在不带风扇的系统中使用。
 Cyrix III是一个Socket 370 PPGA封装,根据VIA的声明,芯片可以在任何一款主板(能够与Socket 370英特尔赛扬运行)上运行。为了充分发挥新款CPU的能力,BIOS必须升级来支持Cyrix III 特有的新特点,如时钟倍频(它不支持英特尔倍频)。与赛扬不同, Cyrix III支持增强型3Dnow! (后Mendocino赛扬 Celeron配有模拟SSE扩展),而且与赛扬偷懒的66 MHz FSB相比,它具有更快的133MHz FSB。Cyrix III还支持MMX。
  VIA是一家不能制造自己芯片的公司。Cyrix III现在由国家半导体公司生产(很有可以采用了国家半导体广泛、信息灵通、与英特尔之间的交换许可权协议,这样Cyrix III便可以在Socket 370封装中运行了)。据报道,VIA正在准备与其它的制造商签订协议。
  英特尔Timna, 即“芯片上的系统”(SOC)将图形控制器以及计算机上几乎所有其它的必备部件集成在该CPU中,是基地位于Santa Clara公司宣扬的赛扬下一代产品。最近 许多媒体报道了英特尔内存转换芯片(MTH)的问题

没有L2缓存

  Cyrix III有一点矛盾,芯片配有巨大的Athlon-esque 128 KB L1缓存,但是却具有像赛扬300那样差的0 KB L2缓存。是的,Cyrix III根本没有L2缓存。Centaur小组决定制造大型的L1缓存,同时去除L2缓存可以减少管芯的大小,降低制造成本,增加产量,提高时钟速度,而且并不削弱性能。其它地方听起来挺合理的,但是我们对性能方面颇有怀疑。
  2000年下半年,VIA计划生产0.15微米的Cyrix III。因为VIA预计芯片的耗电要求会降至仅4W(与Rise的新款芯片保持一致,但仍比Transmeta的Crusoe的耗电大)。随着这一能源的减少,该芯片对手持设备更为引人注目。手持/PDA/网络写字板市场会在今后几年中迅猛发展,所以VIA的定位十分重要,而且颇具赢利性。

性能总结
  Cyrix III可以超频。尽管不能改变缺省的核心电压。通过提高核心电压,更高的时钟速度也是有可能的――甚至1 GHz也不成问题,而且传闻Via在实验室中已经达到这一水准。这种新设计的快速时钟速度是Centaur小组极大的成功。
  芯片能够在较低温度下运作,而且可以不用风扇运行。如果配有风扇,温度就不会超过40度。芯片的耗电很小,这样有可能在Internet设备中使用。今年下半年,管芯准备采用0.15微米工艺,这样耗电量约降至4W左右。由于这种较低的耗电量,我们最终会看到Cyrix III用于手持设备中。加上64KB的L2缓存后,0.15微米的Cyrix III会更上一层楼。
 
  Cyrix III是一块温度适中的低耗电Socket 370 CPU。Cyrix III的最大竞争对手可以是国家半导体的Geode、Transmeta的Crusoe、Rise最新的产品,甚至于英特尔引人注目的StrongArm。

  我国台湾是世界上笔记本电脑领先的制造商。VIA希望而且努力向移动CPU市场推进。Cyrix III可以会引发新款价笔记本电脑设计的浪潮。但是对经济的台式电脑设计而言,笔者建议读者继续坚持功能强大AMD Duron,除非价格是你最大的问题。

2001年CPU市场展望

新一年的来临,PC业界都将所有眼光集中于AMD与Intel的64位处理器上,在过往的CPU价格战中,由于AMD的产品线不如Intel广泛,所以每次都是被Intel牵着鼻子走,Intel降价的频率比AMD的快的多,总是另AMD方面无所惜从。不过从AMD今年的表现可以发现,AMD为谋求得以在高利润领域争取一席之地,分别向高中低、甚至向服务器及商业市场等各方面都全面发展。其实从另一方面考虑,AMD的策略确实对我们消费者有利,大家都应该知道,多种产品同时在一个领域内竞争才不会有垄断的局面。不过无论是AMD和Intel的计划如何,这次X86-64架构的处理器大战都是无所必免的,正所谓“两螃相争,渔翁得利”,得益的最终到是我们这些最终用户。

Intel的产品和特点

最后的希望——Pentium Ⅳ

今年末第一批Pentium 4处理器的频率是1.3G这就是Pentium 4处理器的最低频率。目前Pentium 4处理器使用的是Intel公司自己的Tehama芯片组, Intel公司自己的Tehama芯片组是使用Rambus架构的内存,显然昂贵的Rambus是不利于Pentium 4处理器的推广。不过等Pentium 4处理器正式上市以后威胜公司肯定会推出相应的芯片组说不定能够使用SDRAM架构的内存,到时又有好戏看了。

上面的这些技术参数就Pentium 4处理器的一些外部细节,下面我们来看看Pentium 4处理器内部的改变。

外频是决定CPU速度比较关键的一项指标。大家应该知道AMD的K7系列CPU速度快的一个巨大的原因就是因为它采用了200MHZ外频的EV6总线,而Pentium 4处理器通过使用全新的Quad Date Rate(QDR)技术(4倍频100MHZ的总线技术)达到了400MHZ的外频。在Rambus架构的内存下16位的800MHZ的RDRAM可以提供1.6GB的内存带宽,然而Tehama芯片组提供双管道的RDRAM那么理论上Pentium 4的总线带宽可以达到3.2GB! 这种超高速的外频以及3.2GB的总线带宽会给Pentium 4处理器的带来多大的性能提升呢?答案还是要等今年年底Pentium 4处理器批量投产时才会知道。

高速缓存是决定CPU速度的另一个因素。AMD的钻龙系列CPU只有64K的二级高速缓存,但它的速度却大大超过同频率的拥有几倍二级高速缓存的赛扬2代系列,有些性能甚至超过了Pentium 3处理器,这些根本原因就是AMD的CPU的高速缓存采用了更先进的更有效率的运行方法。同样Pentium 4处理器的一级高速缓存也采用了一种全新的技术:回溯式高速执行缓冲(Execution Trace Cache)这种缓存的运行机制,以及它的原理大家没有必要过多的关心,大家只要了解这是Pentium 4处理器所采用的一种高效率的新技术,它能够给Pentium 4处理器的速度带来巨大的提高!

整数处理能力是CPU运算速度的体现。Pentium 4处理器整数处理单元不多只有2个,但可别小看了这两个整数处理单元,Pentium 4处理器整数处理单元运行的速度是他主频速度的2倍!也就是说1.3GHZ的Pentium 4处理器的整数处理单元运行速度为2.6GHZ!因为有两个整数处理单元那么它的整数处理能力就相当于普通的1个整数处理单元处理器运行在2*2.6=5.2GHZ!从技术上来说就每个时钟周期可以完成4次整数运算。

浮点运算能力是关系到CPU的多媒体,3D图形处理的一个重要指标。AMD的K7系列CPU浮点运算能力之所以能够超过Intel的CPU就是因为它没有采用传统的X87浮点处理单元而使用了自己研发的新型浮点处理机制。现在的Pentium 4处理器彻底摒弃了传统的X87浮点处理架构,改而使用最新的Single Instruction Multiple Data(SIMD,单指令多重数据)指令单元作为浮点处理器,并且这个SIMD单元是64位的。Pentium 4处理器配备了2个SIMD指令单元,一个用来处理寄存器操作,一个用来处理算法操作。从理论上来说如果每次(每个时钟周期)浮点处理的命令由4个操作构成,那么1.3GHZ 的Pentium 4处理器浮点运算能力相当于现在普通CPU运算在4*1.3=5.2GHZ频率下面的处理能力!目前AMD的浮点运算能力是相当于两倍同频率的普通CPU,整整比Pentium 4处理器低了一半。

最后Pentium 4处理器在技术上的优点是可以看得见的,但随着新技术的出现,就一定会有新的问题产生,这点从Pentium 4处理器的工程样品上面就可以看出来。首先核心(Die)的面积大大增加,发热量也大大的增加。接着就是处理器的功率问题,这种高速处理器功率达到60或者70瓦也不奇怪,随着功率增大带来的就是电源功率也必须加大,说不定到时候微机要使用400—500瓦的大功率电源。GTS显卡VOODOO显卡以及Pentium 4个个都是耗电大户并且每个的发热量都相当惊人到时候的微机供电、散热的解决方案是什么呢?我们现在没有必要管这些反正问题出来了总会解决的。

不得不提的就是Pentium 4处理器的工程样品的测试结果非常的不尽人意,它的测试结果还没有同频率的AMD的雷鸟快,分析其原因可能是因为它所才用的回溯式高速缓冲新技术。简单地说Pentium 4处理器在运行中如果分支预测准确它的运行速度会非常得快,如果分支预测不准确,那么Pentium 4处理器将比现在的处理器花费更多的时间去处理。样品始终是样品里最终的产品还是有很大的差别的。我想在Pentium 4处理器上市前这些问题都会得到解决的。

虽然从技术上讲Pentium 4处理器是非常的先进了,是可以彻底的把AMD击败但最终Pentium 4处理器能给Intel带来胜利吗?这还是个未知数。AMD公司也不甘落后,正加快着它的研究速度,等Pentium 4处理器上市的时候谁知道AMD公司会不会生产个什么K8出来呢。Intelr与AMD的战争看来还是会继续打下去,不过我希望Intel的Pentium 4处理器能够为这场战争取得一个小小的战役的胜利,毕竟这是Intel在2001年最后的希望了!

AMD将推出的产品与特点

Sledgehammer(X86-64核心)

  Sledgehammer是AMD第一块的64位处理器,不过基于市场策略,AMD将会推迟至2002年才大批量生产,同时AMD也表示,它们将会在2001第四季度推出一部分Sledgehammer及Clawhammer处理器的样品,界时将会首先应用在部分OEM的原装桌上型电脑上。面对来自Intel 64位Itanium处理器的强大挑战,AMD对此并不担心,并且采取观望的态度。

  众所周知,Itanium与Sledgehammer都采用64位革新的技术,所以它们在推广的同时,还要在X86 32程序->X86 64程序发开上花费大量的时间。但AMD表示,用户可以直接在Sledgehammer的平台上运行所有现存的X86 32位的程序,当然,操作64位的程序也非常容易。其实目前AMD已经为新64位处理器的推广做好的准备,它还提供了一个X86-64技术模拟软件以便于BIOS厂商、工具开发人员、操作系统开发商和软件开发商测试它们的软件,以至缩小由X86 32程序->X86 64程序发开上花费的时间。

Clawhammer(X86-64核心)

  在AMD宣布在2001年底面向服务器市场推出Sledgehammer处理器的同时,AMD同时也宣布将向传统零售市场发布一款代号为Clawhammer处理器。大家不要误会,Clawhammer并非只是Athlon的加强版,它使用的是和Sledgehammer同样的核心设计,同样是具备x86-64技术的新型处理器,只不过面对的对象与Sledgehamme有所不同,它主要应用在普通办公式、家庭式及笔记本型个人电脑上。由于目前AMD对新CPU所透露的内容不多,我们无法进一步得知该处理器详细的资料,不过可以肯定的,它将会未来Athlon的取替者。

Mustang(Athlon Ultra)

  Mustang将会是AMD在推出Sledgehammer前首款打入高端工作站和服务器市场的处理器芯片,Mustang继承了Athlon处理器的核芯结构,采用优化型0.18微米铜芯片制程,内含2700万个晶体管,并集成了全速2MB二级缓存,支持双处理器,Slot A/Socket A双接口,拥有SMP(Symmetric Multi-Processing,对称式多重处理架构)能力,更优化的浮点运算单元和算术运算单元,具有Alpha EV6 266MHz工艺总线技术支持,主频达到的1.6GHz 。也许AMD会在发布同时推出LDT,以大容量缓存和高内存带宽作为卖点。同时它还将推出移动钻龙和速龙芯片,为了能适应移动市场,其中的Mustang将会有更高缓存,并提供更低功率的晶体管。这样,AMD公司既可进军服务器市场,也可抢占工作站市场。

Palomino(aka Corvette)

  在K6-2、K6-3即将退出笔记本电脑市场的情况下,AMD必然需要更新的移动式处理器来取代K6-2、K6-3的位置,因此AMD将推出移动式的Athlon处理器—Palomino,它的核芯设计与Athlon相差不大,不过Palomino的L2缓存 只有256KB,而且它采用的是一种小体积462针无盖PGA封装设计,更适合一般笔记本电脑的使用,同时具备功耗低等特点。另一方面,Palomino将加入第二代PowerNow!技术。目前已经知道支持Palomino芯片组将包括KT133移动版,VIA K7 Twister,ALi Aladdin-K7 M1647等几种。

Morgam (aka Camaro)

  既然有移动式的Athlon处理器,当然少不了移动式的Duron处理器,它采用的是Duron的核心设计,不过这次Morgam的L2缓存容量更小,只有64KB,而插座方面的设计和Palomino类同,同样采用一种小体积462针无盖PGA封装设计。不过值得注意的是,Morgam及Palomino目前都不支持DDR,只兼容一般PC133内存。