admin管理员组

文章数量:1530518

2024年1月19日发(作者:)

如果翻看几年前的资料,可以发现,在那时候,英特尔处理器32nm制程下的两个微架构分别是Nehalem-C和GESHER,尤其是后一个,对我们来说是相当陌生的。

几年前的资料,今天的微架构代号为GESHER

当然很多读者能猜得出,昔日的Nehalem-C就是今天的Westmere(Clarkdale核心Core i5/i3的微架构),而GESHER无疑就是最火热的Sandy Bridge(SNB)。

在希伯来文中,GESHER是桥梁的意思,对于Sandy Bridge来说,这是一个恰如其分的比喻,它是英特尔三个分割世界的综合体:融合了P6(代表Pentium Pro)、NetBurst(代表Pentium 4)的特性,并整合了新一代图形核心,这样的结果使得一个创新的微架构集成在32nm制程的单芯片上。

英特尔的―Tick-Tock‖战略众所周知,―制程技术-微架构‖交替更新,偶数年带来新架构,而奇数年则带来工艺的进步。在2010年伊始,英特尔就将制程提升到了32nm, 而今年微架构将升级到新一代的Sandy Bridge。

历史的钟声刚刚在2011年敲响,英特尔新一代微架构Sandy Bridge就正式发布了,在今后一段时间内, 它将是所有目光的聚焦点。

◆ Sandy Bridge微架构简介

Sandy Bridge是一个全新的基于昔日P6和NetBurst微架构某些元素的集合,虽然它比较相似于P6,但是还是存在着较大的不同,当然了,上一代Nehalem的上一代Core微架构也是脱胎于P6,Sandy Bridge也深深烙下了P6的印记。而像uop缓存和physical

register file(物理寄存器文件),它们都是从NetBurst微架构上汲取过来的。总体上,Sandy Bridge的每个方面都较上一代Nehalem有所提高。

Sandy Bridge核心图

虽然Sandy Bridge还是采用的32nm制程,但相较于Westmere,它真正将GPU与CPU融合,从以前的双U各立山头到合二为一,就是非常大的突破。当然Sandy Bridge的变化并不仅限于此,其主要特性还有:

• 32nm工艺全新微架构,性能更高功耗更低

–新的分支预测单元

–新的Uop缓存

–新的物理寄存器文件

–有效执行256位指令

–放弃QPI,改用环形总线

–最末级缓存LLC机制

–新鲜的系统助理

• 32nm工艺新一代图形引擎,出色的媒体与视频性能

• 高级矢量扩展指令集(Intel AVX),加快浮点运算密集型应用

• Turbo Boost 2.0睿频技术,动态调控CPU和GPU频率

从Nehalem开始,英特尔将处理器核心分为了核心(Core)与非核心(Uncore)两部分, 我们在讲述Sandy Bridge架构上改进的时候,也将分开Core和Uncore来叙述,不过需要先了解一下CPU内部的工作流程。

◆ CPU工作流程

P6是首个乱序执行(Out of Order Execute)的微架构,作为P6繁衍的产品,Sandy

Bridge和Nehalem都是采用乱序执行超标量(Superscaler)x86指令的架构,其内部的工作流程基本如下:

一套完整的计算机程序是由很多指令组成的。在执行前,程序首先被加载到内存中,程序执行时,处理器首先要从内存或高速缓存中获取指令,这个过程被成为取指 (Instruction

Fetch)。在处理器取到指令后,需要判断这条指令是什么类型的指令,究竟要执行什么操作,这个过程被称为译码 (Decode)。在指令被译码后,需要为这条指令分配它计算所需要的资源,例如加法器等,这个过程被称为分派和发射 (Dispatch和Lauch);指令在计算单元中具体执行的过程被称为执行 (Exectue);执行结束后,需要将运行结果存回目标地址,这个过程被称为回写 (Write Back)。

如图上所示,在处理器内部的电路单元设计与上述过程是一一对应的。Sandy Bridge对比Nehalem在核心部分就以上每方面都做了相应的改进。

在深入了解Sandy Bridge微架构之前,首先我们先来了解一下Nehalem微架构处理器的核心功能区间划分:

Nehalem核心微架构图

Nehalem微架构中的任何一款处理器其核心(Core)部分的电路设计均如图上所示,只有非核心(Uncore)部分不同,以及是否遮蔽了超线程技术。Sandy Bridge微架构采用了同样的方法用以划分高、中、低端产品。

从下文开始,将开始介绍Sandy Bridge在Core部分的具体改动部分。

◆ 取指:新的分支预测单元

CPU前端的主要任务是从指令流传递足够Uops(微操作)来保持后端饱和状态,指令流的传递总是受到分支的干扰,Intel的微架构一个比较注重的地方就是分支预测,分支预测在每一代都有所提高。

Sandy Bridge保留了Nehalem的四个分支预测器:分支目标缓存(the branch target

buffer)、 间接分支目标阵列(indirect branch target array)、回环检测器(loop detector)

和命名返回堆积缓存(renamed return stack buffer)。不过Sandy Bridge将分支预测器(Branch Predictor)从取指单元( Instruction Fetch Unit )中分离出来并重新定义分支预测单元(Branch Prediction unit)。

新的分支预测单元主要提升了CPU内部对嵌套语句预测的正确率与预测速度:

1、支持多个不同的分支目标大小,能够跟踪更多分支目标;

2、将分支按照长短不同历史进行划分;

3、分支历史表中同样的位可以对应更多分支。

当前的处理器大多是超标量流水线结构,因此流水线中一般都有几十条指令在同时运行。如果其中一条分支指令的预测产生错误,处理器将不得不清空流水线中分支指令后的所有指令,并且从正确的位置重新取指、译码、执行。这样即会导致处理器的效率严重降低。由于程序中分支指令往往较多,因此分支预测的正确率对处理器的性能有着至关重要的影响。

◆ 译码:新的Uop缓存

在Nehalem微架构的CPU中,经过译码后生成Uop(微操作)储存在解码后指令缓冲中,当CPU执行指令时,循环流检测器会检测其中数据中的循环,只要满足小于等于Uop的限制,那么Nehalem就可以将这个循环保存起来,不再需要重新进行取指、分支预测、译码等操作,从而提升了对于循环处理的性能。

不幸的是这28条Uop实在是太少,一旦发生高速缓冲未命中,特别是在SMT同步多线程之后,未命中率加倍的情况下,这时候CPU就不得不到从内存中查找数据,这将极大的降低CPU的运算效率。有鉴于此,在新的Sandy Bridge微架构中对该限制进行了大幅改善,相关的限制有28条大幅扩展至1500条,大幅降低了高速缓冲未命中发生的几率。

Sandy Bridge在前端增加了译码Uop缓存(Decoded Uop Cache),总容量为1.5K uops,据Intel表示,Uop缓存像一个6KB执行指令缓存,拥有大约80%的命中率。相比之下,p4 12K Uop的追踪缓存的性能应该类似于8KB-16KB的。然而,Uop缓存命中可以跨越32B完整的指令窗口,这加倍了传统的前端带宽,它仅限于16B的指令提取。

Sandy Bridge的Uop缓存和P4的追踪缓存关键差异之一是Uop缓存是为了从根本上增强传统的前端。相比之下,P4企图利用追踪缓存以取代前端。

Uop缓存是Sandy Bridge最有前途的功能之一,它同时降低功耗和提高性能,它避免X86耗电的解码,横跨数个流水阶段,需要相当昂贵的硬件来支持不规则的指令集。一般来说,Uop缓存似乎避免了追踪缓存上的一些问题,同时提供了更节能的方式。

◆ 分派和发射:物理寄存器文件

Sandy Bridge的乱序执行是P6和P4微架构的结合,Sandy Bridge的前端可从两个线程的其中一个提供4个Uop/每周期。Uop此时仍是按有序进行,并分配必要的资源来跟踪执行。每个Uop分配一个序列进入到ROB(Reorder Buffer),跟踪状态和完成情况,并维持正确的程序顺序。

一旦Uop已分配和重新命名,它们可以自由地执行乱序工作。Sandy Bridge使用是一个统一的调度程序(Entry Unified Schedule)实现线程之间动态共享,但容量是Nehalem的1.5倍。这促就了更灵活的指令组合,以有效地执行指令任务。一旦Uop准备就绪,它会发去相应的执行单元。像Nehalem/Sandy Bridge可以发出6个Uop到不同的端口和每周期撤离4个Uop。

重要的是,在Nehalem架构中,位于乱序执行调度阶段的退回寄存器文件(Retirement

Register File)单元每时钟周期只可以执行4个Uop的寄存器文件写入。而在Sandy Bridge架构中,该单元被重新设计为物理寄存器文件(PRF,physical register file),其寄存器文件中存储的是Uop操作数,而微操作在乱序执行引擎中只会携带指向操作数的指针,而非数据本身。这就大大降低了乱序执行硬件的功耗(转移大量数据很费电的),同时也减小了流水线的核心面积,数据流窗口也增大了三分之一。

实际上PRF早在NetBrust微架构的P4上就得到应用,这次再现于Sandy Bridge,RPF的使用加大了乱序执行缓冲,能够很好地满足更高吞吐量的浮点引擎,配合AVX(Advanced Vector Extensions,高级矢量扩展)指令集,让浮点性能更上一个台阶。

◆ 执行:有效处理256位指令

Sandy Bridge执行单元经过修改,通过有效地执行256位AVX指令,可量化地增加了一倍的浮点性能,几乎所有的256位AVX指令解码成并执行一个单一的Uop。不过Sandy Bridge并没有将数据通道拓宽到256位,而是将SIMD整数堆栈归到不同的端口,而是巧妙地重新利用现有的128位SIMD和128位浮点数据路径共同执行256位Uop。

在以往的Nehalem架构中,载入和存储地址的两个端口功能是固定的,在Sandy Bridge架构中,这两个端口同时具有载入和存储地址的功能,在执行单一操作的时候将得到成倍的性能增长。

Sandy Bridge也提高了特定的安全性能,如AES(Advanced Encryption Standard),在上一代的Westmere微架构中其实已得到应用。Sandy Bridge还提高了SHLD性能,这应用于SHA-1散列,其它的像大量数字的微操作吞吐能力也进行了一定的增强。

◆ 放弃QPI,改用环形总线(Ring Bus)

在Sandy Bridge中,我们可以认为核心部分只是一系列的改进,而在非核心(Uncore)部分的改动却是巨大的。英特尔在Sandy Bridge中加入了一系列新的技术,使得新老两款产品有了本质的区别。

Clarkdale核心图

在Nehalem和Westmere微架构中,处理器核心与PCIE控制器、内存控制器、GPU图形核心之间是通过QPI总线相连的,而在Sandy Bridge中,CPU核心和GPU核心得以完全融合,英特尔也放弃了使用已久的QPI总线方式,改为采用在服务器处理器常用的环形总线(Ring Bus)。

Sandy Bridge主要模块对应三个功率和频率域:核心和最末级缓存(LLC,Last

Level Cache,即L3)、GPU和系统助理(System Agent),前两者的电压和频率是可变的,而系统助理则以固定频率运行,环形总线将这几部分互连起来。

这条环形总线由四条独立的环组成,分别是数据环(DT)、请求环(QT)、响应环(RSP)、侦听环(SNP)。每条环的每个接入点在每个时钟周期内都能接受32字节数据,而且环的访问总会自动选择最短的路径,以缩短延迟。

Sandy Bridge环形总线具备六个―站台‖,四个核心和LLC的共享站台,还分别为图形和系统助理准备的两个站台。每一个站台通过每个连环进入到三级缓存(LLC)。它不再像Nehalem和Westmere一样是统一的实体,而是被分配更高带宽和关联性(类似于Nehalem-EX和Westmere-EX)分区。

◆ 最末级缓存LLC机制

在Nehalem中,三级缓存作为处理器核心的附属品,只能被处理器核心访问。在Sandy Bridge中,传统的三级缓存除了处理器核心之外,系统助理(System Agent)和集成图新核心(Integrated Graphic)都通过环形总线都拥有属于自己的接入点,可以直读写问其中的数据,英特尔将这种全新的缓存机制命名为最末级存(LLC,Last Level Cache)。

从英特尔公布的数据来看,最末级缓存具有路由分派机制,同时内部被划分成多个区块,分别对应一个处理器核心,每个处理器核心都在环形总线上有自己的接入点和完整缓存管线,单个处理器心带宽是96GB/s,每个处理器核心都可以访问全部最末层缓存,不过延迟不同。

由于LLC机制的出现,将会带来更好的图形性能,更高的内存带宽(系统助理包括有内存控制器),以及更加省电。

◆ 新鲜的系统助理(System Agent)

在Sandy Bridge中,系统助理(System Agent)被设计成了一个独立的部分,这部分从功能上来说相当于传统的北桥芯片,系统助手通过接入点与环形总线连接,以固定电压和频率运行,包括了以下几部分:

·PCI-E控制器,支持单条PCI-E x16或者两条PCI-E x8插槽

·重新设计的双通道DDR3内存控制器,

·DMI总线接口

·显示输出控制单元

·电源控制单元

系统助理的最重要的部分之一是电源控制单元(PCU),PCU作为微控制器,它负责芯片级电源和热管理,包括―Turbo Boost‖模式,对图形的核心和缓存进行动态调节,采用了更先进的模型芯片。

此前,GPU是基于一个分散核心,由驱动程序进行管理,现在Sandy Bridge将图形和CPU集成到一个单一的芯片上,PCU可以灵活地管理功率和TDP。Sandy Bridge通过共享图形和CPU之间的电能等资源,能为大多数应用提供更高的性能,而不是静态分配功率和热预算。

Sandy Bridge的每个核心可以进行电源控制,而缓存和环形总线并不能实现这个功能,因为它们所有组件共享。然而,英特尔的三级缓存会因待机而进入睡眠状态,目的是为了降低动态和待机功耗。当它们不被使用时,也同时降低了环形总线的待机功耗。当然,系统助理必须始终保持活跃的状态,因为它包括PCU,会收到来自DMI时钟发生器的信号。

◆ Turbo Boost 2.0技术

Turbo Boost技术是跟着Nehalem架构出现的,新一代Turbo Boost 2.0在原有的基础上改进了算法,增强了自动提速的弹性,甚至可以动态调控集成的GPU的频率。

亮点一:Turbo Boost 2.0可以突破TDP硬上限

Turbo Boost加速的智能性并不代表它是完美无缺的,TDP功耗成为频率提升的硬上限,一旦达到TDP功耗,CPU频率就会降至正常值,大部分桌面级CPU的提升只有1-2 bins左右,CPU实际性能提升只能说是聊胜于无,而在Turbo Boost 2.0技术的帮助下,CPU的提升会达到3-10 bins,在低功耗版本中,可提升幅度最大。

Turbo Boost 2.0可以短时间突破TDP功耗限制

在Turbo Boost 2.0中,TDP方面的限制有所放松,PCU单元可以控制active core在较短时间内突破TDP上限之后才会逐渐降至稳定状态,IDF会议上的资料显示最高峰阶段长达25秒,不要小看这一点时间,这只是一个加速周期循环,等到CPU的发热被带走之后,Turbo Boost 2.0也会进入下一个25秒的加速循环,这样累积下来的提速效果将比目前1-2 bins的提升更为明显。最重要的是,用户也不必担心这样做会损坏CPU,因为短时间超越TDP功耗依然处于安全设计内,Intel不会做这种亏本生意的。

亮点二:Turbo Boost 2.0联动加速CPU和内置GPU

另一个值得注意的功能是Turbo Boost 2.0中不仅能调节CPU频率,也会对集成GPU同样也会起到加速作用,并随着系统负载的不同协调二者的频率升降。

在今年发布的clarksfield核心的i5、i3处理器中,Intel已把GPU集成到CPU而非芯片组中,虽然当时只是将二者封装在一起,但是我们之前的测试中,已经揭示了GPU频率与BCLK频率存在联动关系。

CPU与GPU功耗的一体化管理

到了SNB架构中,GPU将会与CPU真正集成在一个核心内,二者的关系会更密切,Turbo Boost 2.0也会一体化管理GPU和CPU的能耗,并在需要的时候动态提升GPU的频率。这种改变带来的影响也会更大,例如多数游戏中CPU性能都是过剩的,Turbo Boost

2.0可以根据系统负载而向GPU倾斜,大幅提升GPU的频率以改善性能,再加上SNB中GPU架构的革新带来的性能提升,Intel新一代CPU的图形性能有可能咸鱼翻身,进而颠覆整个低端CPU/主板市场。

Turbo Boost 2.0将会带来更多收益

等到Sandy Bridge架构的CPU正式上市之后,凭借先进的32nm High-K工艺所带来的低功耗、低发热优势,Turbo Boost 2.0加速无疑有了更大的发挥空间。SNB架构的CPU频率覆盖2.2-3.4GHz,像Core i7-2600默认为3.4GHz,在Turbo Boost 2.0的加速下四个核心可以达到3.8GHz,单核心甚至能达到4.2GHz的高频,可以藉此一圆P4时代未竟的4G梦想。

亮点三:新增Turbo Boost监控软件

Turbo Boost 2.0新增有频率变化监控器

Turbo Boost 2.0有相应的监控软件,可以即时显示CPU的频率变化,界面很美观,就是一CPU外形,像Core i5-2500的默认频率为3.3GHz,界面上根据频率的变化显示相应的数值和柱状图,如3.5GHz,超出部分的颜色会有所区别,非常直观和人性化,方便用户监控。

◆ 新一代图形核心架构

Sandy Bridge核心架构

与Clarkdale不同,Sandy Bridge架构中Core和GFX部分均统一采用了32nm工艺制程,并且集成双通道内存控制器和PCI Express 2.0控制器。

Sadny Bridge的最大改进在于三级缓存(LLC)改用了环形总线设计,延迟缩小至25个周期,并且其核心、GFX以及显示/媒体控制器可共享L3高速缓存。这样优势是不言而喻的,处理器的各个Core、图形核心(Grapchis)、系统助理(System Agent)均可直接在L3缓存中进行通信。

Graphics内部具备多个执行单元

Sandy Bridge按照型号划分了标准版以及―K‖系倍频解锁版本,标准版本GFX命名为HD Graphics 2000,而唯独K系列所拥有的GFX为等级更高的HD Graphics 3000。

HD Graphics 2000与HD Graphics 3000的区别是前者拥有6个执行单元(Execution Units),而后者则达到了12个,在性能上将会得到大幅提升。

内建图形核心解析

Sandy Bridge的Graphics部分主要包含了指令流处理器(Command Streamers)、媒体处理器(Media Processing)、多格式媒体解码器(Multi-Foumat Codec)、执行单元(EU)、统一执行单元阵列(Array of Unified Execution Units)、媒体取样器(Media Sampler)、纹理采样器(Texture Sampler)以及指令缓冲等等。

Intel HD Graphics 3000

Intel HD Graphics 3000

◆ 多媒体处理器

Sandy Bridge已超越了传统意义上处理器的理念,称之为多媒体处理器更加贴切。其中所整合的图形单元可高效执行视频解码功能。在Graphics部分包含了多格式媒体解码器(Multi-Format Codec),这是一款专用的并行引擎,可支持MPEG-2/VC-1/AVC编码格式视频解码,并且提供了对MVC格式立体3D视频播放的支持。

需要强调的一点是,Sandy Bridge GFX的解码全部由多格式媒体解码器所完成,优化CPU性能,不会再动用到内部执行单元(EU)阵列。

在视频编码方面Sandy Bridge同样出色,主要通过可编程的执行单元阵列来操作,在运动估算以及执行模式方面更加灵活,可在媒体取样器(Media Sampler)中录入高输出量的VME(Video Motion Estimator),再递交给统一执行单元阵列处理。

在编码/转码过程中,Sandy Bridge可实现AVC的完全硬件加速。

◆ 色彩处理加速(Color Processing Accelerators)

Sandy Bridge具备色彩的像素处理后台,主要功能包括:STE——增强皮肤色调;ACE——自适应对比度增强;TCC——全局色彩控制。(可在Intel CUI中开启及控制)

STE增强皮肤色调原理

STE增强皮肤色调应用实例

ACE自适应对比度调节原理

ACE自适应对比度调节应用实例

TCC全局色彩控制原理

TCC全局色彩控制应用实例

◆ 认识Sandy Bridge处理器

LGA 1155 & LGA1156接口辨识

众所周知,Carkdale采用的是LGA 1156接口,而Sandy Bridge则改为了LGA 1155接口,两者虽然仅1个触点的差别,但是从上面的两幅实物图可以看到,LGA 1156与LGA 1155处理器两边的凹位是不一致的。如果以凹位到处理器中轴线(横)的垂直距离来算,LGA 1156的为9mm,而LGA 1155则为11.5mm,故两者是互不兼容的。

此外,P67/H67与P65/H65主板所支持的散热器孔距是一致的,故Clarkdale与Sandy Bridge的散热器是通用的。

Sandy Bridge新命名规则

为了能够让消费者更容易区分新旧产品,Intel为Sandy Bridge处理器推出了新的Core ix-2000命名方式,其中Core i7系列为2600,Core i5系列为2500/2400/23x0,而Core i3系列为21x0,入门级的Pentium系列则为G8x0及G620几个型号。按这样的方式推算,应该还有i7-2700和i3-2200等后续产品出现。

其实Core ix-2000的命名方式与Intel过往Core品牌的风格类似,拿上面的Core

i7-2600K为例。

"Intel Core"为品牌名称;"i7‖则为所属系列("i7"定位桌面旗舰,―i5‖定位中端领军人物。―i3‖则定位Core家族入门级);―2600‖表示产品的具体型号;―K‖后缀则为版本标识(普通版不标注,K为倍频解锁版,S为节能版,T为超低功耗版)。

Snady Bridge处理器几个系列的区别方法也相当简单,只要捉住以下几点即可加以区分:

1、Core i7系列为8线程,拥有8MB L3缓存,支持Turbo Boost技术;

2、Core i5系列为4线程,支持Turbo Boost技术,拥有6MB L3缓存;(唯一例外的是Core i5-2390T为双核4线程,3MB L3缓存)

3、Core i3系列为2核心4线程,不支持Turbo Boost技术,拥有3MB L3缓存;

4、Pentium系列则为2核2线程产品,不支持Turbo Boost技术,拥有3MB L3缓存。

Sandy Bridge处理器型号列表

最后需要说说集成的显卡方面的区别:Sandy Bridge中的倍频解锁版本(K系列)的GFX命名为Intel HD Graphics 3000;其余Core i7/i5/i3系列标准版、节能版(S)及超低功耗版(T)的GFX均称为Intel HD Graphics 2000;而入门级的Pentium系列GFX则依旧为Intel HD Graphics。

Intel的几款HD Graphics在性能上是存在一定差距的,值得强调的是HD Graphics均可支持核心频率动态调节,例如最高型号的Core i7-2600K其核心频率可由850MHz提升至1350MHz。

◆ 认识6系列主板芯片组

Intel Sandy Bridge处理器所配套的主板芯片一如既往地划分了诸多型号:在商用平台上会有Q67、Q65和B65,而消费级平台则为P67、H67和H61。

英特尔主板芯片组路线图

P67和H67将代替现有的P55、H57和H55位置,而在第二季度将发布入门级产品H61,代替现有的G41,这代表着服役多年的LGA 775处理器将会被LGA 1155彻底淘汰。

英特尔P67主板芯片平台结构图

从上面的P67芯片组平台结构图可以看出,PCI-E总线和内存控制器继续被CPU所集成,处理器中的PCI-E通道能支持x16或x8+x8模式,P67芯片组已得到NVIDIA SLI的授权,可以组建双路x8模式的SLI和CrossFireX。

P67 PCH芯片提供14个USB 2.0接口,很可惜依然不支持USB 3.0,值得高兴的是,在它提供的6个SATA接口中,有2个是SATA 6Gbps接口,这意味着英特尔在6系主板中开始原生支持新一代的SATA标准。P67还支持"Intel Extreme Tuning‖内存优化技术。

英特尔H67主板芯片平台结构图

H67芯片组可以使用处理器的集成显示核心,支持HDMI和DisplayPort的输出,为了不至于让DMI总线过于拥挤,英特尔在H67上单独开辟了一条专用通道来传送显示数据,即FDI(Flexible Display Interface),这和H55上的做法是一样的。

与P67相比,H67不允许CPU提供的PCI-E通道拆分,也就是只能是x16的单插槽模式,考虑到H67本身还提供有8条PCI-E 2.0通道,因此理论上至少还可以组建x16+x4模式的双卡互连(考虑到其它设备或许会占用一两条通道)。H67也提供了两个SATA 6Gbps接口,但是不支持内存优化技术。

而入门级的H61可以说是P67的精简版本,不支持SATA 6Gbps,USB 2.0接口删减到10个,PCH芯片组内提供的PCI-E总线也仅有6条,不支持RAID。H61最多只有两个内存插槽,每个通道一条插槽。

英特尔6系列和5系列消费级芯片组的规格对比

英特尔6系列与5系列主板最大的区别在于对SATA 6Gbps的原生支持,P67和H67都有两个原生的SATA 6Gbps接口。此外6系列芯片组PCH所提供的PCI-E总线速度由原来的2.5GT/s提升到了5GT/s,带宽提升了一倍(单向带宽达到500MB/s),这样的好处是不用再为带宽多虑了,对于第三方所提供的USB 3.0和SATA 6Gbps接口就有了足够的带宽,不需要再用PLX芯片来解决带宽瓶颈问题。

另外,英特尔在6系列芯片组中放弃了对PCI总线的支持,目前P67、H67主板上的PCI插槽都是通过第三方芯片由PCI-E通道桥接而来的。

◆ 全文总结:更好的性能更低的功耗

英特尔的―Tick-Tock‖钟摆发展模式正紧跟着时间齿轮而有条不紊地前行,Sandy Bridge微架构的诞生为消费者们带来了新的惊喜。―更好的性能更低的功耗‖,这应当是Sandy

Bridge处理器最贴切的写照。

· AVX:Sandy Bridge最重要的改进

无疑,AVX指令集的加入是Sandy Bridge最为重要的改进,AVX把处理器的矢量处理能力提升至256bit,浮点性能得以激增,速度相比SSE更上一个台阶。浮点运算能力一直是GPU的强项,而AVX指令集的加入则让CPU拥有了可冲击GPU浮点性能的可能。

· 更智能的处理器

新一代的Turbo Boost 2.0技术增强了Sandy Bridge自动提速的弹性,除CPU外还可对GFX进行加速,并随着系统负载的不同协调二者的频率升降,表现得更加智能化。

· 真正的CPU/GPU融合

如果说一年前发布的Clarkdale开创了CPU整合GPU的先河,那么Sandy Bridge则是整合的完美形态。Intel终于在Sandy Bridge中实现了Core和GFX的融汇贯通,采用相同的32nm工艺。

Sandy Bridge采用了环形总线设计,Core与GFX还有系统助理共享L3缓存,新架构上的改进使得整合图形核心性能得到史无前例的飞跃,Intel HD Graphics 3000已拥有了超越低端独立显卡性能的筹码。

当然,CPU和GPU融合的最早提出者应该为AMD,经过无数次的跳票之后,AMD的Fusion也将会在今年一展其抱负,表现几何还有待分晓。

· 综合性能更出众

定位相当的Sandy Bridge与Lynnfield处理器相比,在基础性能方面有着非常可观的性能提升(Core i5-2300比Core i5-750平均领先18%),而且在功耗和温度方面均有更佳的表现。另外,Sandy Bridge即使与Bloomfield处理器相比,同频性能也能够更胜一筹(4GHz的Core i7-2600比同频的Core i7-920平均性能领先15%)。

· 市场展望

当然了,Sandy Bridge相比Clarkdale乃至Bloomfield来说均有许许多多值得称赞的改进之处,而唯一为人所诟病的则是其在超频方面的表现。由于外频存在难以逾越的障碍,导致了标准版Sandy Bridge的超频性能低下,热爱超频的玩家们只能选择K系列解锁倍频版本了,相信这又是Intel细化市场的一种手法,对于更多的大众玩家来说,还有少量倍频可以提升,基本也可以得到满足。

然而英特尔在2008年将桌面处理器接口改为LGA1366,又在2009年推出LGA1156接口处理器,今天,Sandy Bridge又改用LGA1155接口,步子无疑迈得有些大了,引得用户无数抱怨。

前段时间有报道称,目前LGA775用户还占有大半壁江山,在如今看来,LGA775确实是―廉颇老矣‖,在Sandy Brige及相应的6系列主板大批量上市后,如果不追求极致性能,LGA775用户―连跳三级‖直接升级为LGA1155平台,无疑是非常聪明的选择。同时也折射出目前LGA1156平台的尴尬处境,必将沦为过渡的产物,成为英特尔CPU史上的匆匆过客。

在英特尔的Roadmap中,至少在今年上半年,高端的产品还是由Core i7系列的Bloomfield和Lynnfield处理器担当,Clarkdale则被Sandy Bridge彻底淘汰掉,Sandy

Bridge微架构产品在Q2之后继续向低端市场延伸。顶替X58+LGA1366的高端平台需要等到第四季度,代号为Patsburg的芯片组和LGA2011接口的Sandy Bridge-E处理器将是它们的接班人。

英特尔已经布下局摆好阵,AMD的Bulldozer何时才能开动起来?

本文标签: 处理器性能核心缓存架构