泡泡网CPU频道 PCPOP首页      /      CPU     /      新闻    /    正文

AMD展望2011:三强持家 CPU/GPU共和

    泡泡网CPU频道5月24日 仔细一算,AMD公司已经有7个月没有推出新设计的CPU产品了。不过据我们所知,Phenom II产品很快便将被一款新产品所取代,这款新产品的设计将面向服务器,台式机,笔记本和上网本三大平台。AMD新设计的处理器产品将被分成三大系列:Bulldozer,Bobcat以及Llano。预计这三款产品上市之后,AMD与Intel之间的竞争将重新回到白热化的阶段,以下我们便分门别类为大家提前介绍一下这三种设计的产品。

    Bulldozer:专为电脑发烧友设计

AMD展望2011:三强持家 CPU/GPU共和

    基于Bulldozer核心设计的处理器产品可伸缩性很高,每个基本核心模块中内含两个处理器核心,并可以基本核心模块为单位进行组合。其中每个基本模块中都采用了名为簇式多线程( Cluster-Based Multi-Threading:CMT)的技术.

    要理解CMT的概念,我们可以首先看看其同胞兄弟SMT(对称多线程),Intel P4处理器上的超线程Hyper-Threading便是基于这种技术.

AMD展望2011:三强持家 CPU/GPU共和

    在Intel的SMT方案中,采用的是复制处理器架构状态的方法来实现SMT,也就是说处理器核心内部并没有增设一套额外的硬件执行单元来处理SMT,而只是增加了处理器中存储线程有关数据的单元数量,并在硬件执行单元空闲时将这些数据送往其中处理,以便增加处理器执行单元的利用度。

    形象地说,Intel的超线程技术就像是汽车厂中的一条装配线,尽管装配线只有一条,但线上的每一个工步随时都可以收到供装配汽车用的零件,不会因为零件没有到位而导致装配线停等零件的现象。

    经过多年的推广,目前的许多操作系统已经可以很好地配合Intel的超线程技术,充分保证Intel超线程处理器的流水线利用度。

    不过这种设计也有一些缺点存在,它只使用了一个指令窗口( instruction window:负责缓冲,调度指令的单元)来负责两个线程的调度,执行和引退。回到我们上面装配线的例子,这就像是生产线只有一名管理调度人员,一个人显然很难同时处理两套任务,这样有时候便会出现产线故障,而处理器在碰到这种情况时性能则会出现明显的下降。

    而Bulldozer的每一个模块中则加入了额外的执行单元,每一个模块都具备可以将一个大任务细分为多个并行任务的能力,这些生产线可以按需要任意整合,不会对整个装配线的效率造成影响,这就是所谓的CMT技术。

    CMT要比超线程技术具备更好的效率和性能表现。

AMD展望2011:三强持家 CPU/GPU共和

    当Bulldozer处理器在流水线之间传输计算结果时,这些计算结果会被储存在缓存中,程序则可从一级数据缓存中读取这些计算结果。这些数据就像是汽车厂中已经安装完成,等待发往客户的成品车。Intel的超线程技术好比汽车厂的成品车全部停放在一个停车场上,这里停有各种型号的成品车,如轿车卡车等,这样当只需要卡车的提车客户前来提货时,其提货的效率便较低。而Bulldozer中则设置了两个这样的停车场。

AMD展望2011:三强持家 CPU/GPU共和

    Bullzoer的两条流水线共享一个浮点调度单元(图中打红色圈的部分),具备两个128bit FMAC(融合型多精度)流水线,浮点运算的精度更高,这样Bulldozer处理器在进行浮点运算时的效能和精度将比现有的Phenom II有明显的提升。

    128bit FMAC浮点管线还能够满足AMD Bulldozer中新加入的SSE5以及AVX指令集扩展的需求,这种指令集扩展中包含大量128bit多媒体指令。而且采用FMAC技术之后,还可以达到在一个周期之内完成Intel AVX指令运算的目的。SSE5和AVX指令集扩展对提升处理器的多媒体,加密以及科学运算性能方面意义重大。

    最后,Bulldzoer中还对PhenomII处理器的缓存结构进行了改进,现在处理器中的二级,三级缓存均采用共享型结构,每个模块中的两个核心均可共享这些缓存。

    Zambezi:

    AMD推出的首款Bulldozer核心处理器产品将是代号为Zambezi的产品,这种产品中包含四个基本模块(每个模块包含两个处理器核心),据悉Zambezi将仍采用AM3插槽形式,这样理论上说所有目前的PhenomII DDR3主板只要通过BIOS升级便可支持这种新处理器。

    不幸的是,目前Bulldozer核心的一部分技术细节仍没有被AMD方面公开,这些疑问包括:

    -Bulldozer核心中的“装配线管理人员”--指令调度单元每次能同时管理几部“车辆”--线程的装配流程?
    -Bulldozer的流水线级数到底有多少?
    -Bulldozer内部的浮点执行单元具体是如何配置的?
    -模块内部的两条流水线是如何共享单个浮点执行单元的?

    由于缺乏这些信息,因此我们目前还很难判断Bulldozer处理器相比目前的处理器产品而言性能提升幅度到底有多少。

    Bobcat: 面向上网本的处理器产品

    Bulldozer之后,AMD还将推出另外一款产品系列,这便是Bobcat,这种架构主要面向的是类似Athlon Neo和Intel Atom这样的上网本处理器产品。

    根据AMD公司的产品路线图显示,首款采用Bobcat设计的处理器将是32nm制程,代号Ontario的APU处理器产品,这款处理器内部整合了两个Bobcat处理器模块,并集成了DX11 GPU集显。

AMD展望2011:三强持家 CPU/GPU共和

    每个Bobcat处理器模块均包含一个处理器单核心,在单核心内部设置了一个整数调度器和一个整数执行单元,这个整数执行单元中包含I-管线,Ld-管线和St管线三个部分,这三个部分各自负责不同种类任务,就像装配线上的电器安装工和机械安装工那样进行分工。而Bulldzoer核心中的整数调度器也负责管理四条整数流水线,不过目前为止我们还不清楚这四条整数管线各自负责的是哪些具体的工作。

    除了整数部分之外,Bobcat核心内部还设有双管线结构的浮点处理部分,这两条浮点管线被分别命名为“A管线”(加法管线)和“M管线”(乘法管线),分别负责浮点数的加法运算和乘法运算。

    功耗方面。Bobcat核心的待机发热量不足1W,仅0.5W左右,实际使用时的TDP则将在5-10W左右,非常适合上网本使用。

    性能方面,AMD宣称Bobcat处理器可达到“现今主流处理器性能的90%左右”,而核心面积则可比后者小一半。假如他们这里所说的”主流处理器“指得是Athlon II的话,那么我们基本可将这款处理认为是AthlonII的缩减尺寸及功耗的版本。

    不过Bobcat处理器最引人注目的地方并不是其架构设计,而是AMD在设计这款处理器是所采用的新设计技术。他们采用了一种名为HLS( high-level synthesis)的设计技术来设计这款处理器,设计者使用C++程序来设计处理器的行为模式,然后再将这些程序代码输入制造设备,便能制造出满足要求的产品。HLS技术具备设计速度快,产品易于调整转换的优点,不过采用这种技术设计出来的产品在运行频率方面则不如手工设计的产品,据AMD方面透露,使用HLS技术设计出来的Bobcat处理器在运行频率方面要比手工设计的产品低20%左右。

    综合地看,Bobcat处理器将比现有市面上的超低电压处理器如威盛Nano,Intel Atom和AMD Athlon Neo等处理器更快,而且还具备HLS技术做后盾,产品改进对市场需求的响应速度会更快,这些是采用老办法设计出来的对手的产品所望尘莫及的。

Fusion:面向笔记本和低端台式机

    2006年10月26日,AMD公司完成了收购ATI公司的工作,当时他们曾郑重其事地发表了以下一段声明:

    “AMD计划设计一种新的X86处理器,这种处理器将原生整合CPU核心和GPU核心,这款产品的开发代号是‘Fusion’。”

    不过AMD在开发Fusion方面的进展似乎并不顺利,Fusion的上市计划一拖再拖,甚至等Intel推出了自己的集显产品很久之后,最先发表声明会推出集显处理器的AMD还没有太大的动静。不过考虑到Intel的集显处理器产品在GPU性能方面实在与ATi/Nvidia的现有产品难以比肩,因此人们对Fusion仍然抱有较大的期望。最近AMD终于宣布明年将推出代号为Llano的Fusion处理器。

    Llano:

    Llano将是AMD Fusion处理器面世的首款型号。按照今年早些时候AMD公布的Llano核心照片显示,这款处理器的核心与Athlon X4(核心代号Propus)非常相似(如下面的对比图显示的那样),只不过制程由45nm进化为32nm,并加入了GPU核心单元而已。

    Llano和Propus同样是面向主流市场的产品,因此这样的比对结果并不令人意外,毕竟将现有的设计改进制程之后推出新产品相比重新设计整个处理器核心所花费的时间要少得多。

AMD展望2011:三强持家 CPU/GPU共和

    值得一提的是,上图中Llano的核心扫描图显示的核心还没有完成全部的设计,图中可见芯片的底部的GPU等部分在对外发布时被做了模糊处理,这意味着将来实际面世的Llano将与图中所示的存在较大的差别。

    但根据现有的资料和图片,我们可以看到Llano内部每个核心将配备512KB-1MB容量的二级缓存,没有设置三级缓存,另外GPU部分则将配置6个基于HD5000系列设计的480个流处理器单元。

    简单地说,Llano其实就像是Athlon II X4核心加上打开六成(66%)功力的Radeon HD 5750而构成的一款产品,从这点上看,至少在图形性能方面要比Intel现有的Clarkdale和Arrandle处理器要强不少。

    在我们对全文进行总结之前,我们先来总结一下目前为止在本文中提到的几种架构和产品:

AMD展望2011:三强持家 CPU/GPU共和

    总结:

    AMD很早以前开始便一直在念叨“未来属于Fusion”,现在他们终于了亮出了把式,2011年前,AMD公司所有面向台式机,笔记本以及上网本的处理器产品均可按市场的需求采取集显设计。

    也许读过本文的读者会对这种说法有所质疑“不是说Llano才是唯一采用集显设计的产品吗?”,实际上,只要市场需求足够旺盛,AMD完全有能力将集显设计加入到Bulldozer或是Bobcat中去。

    尽管AMD首款Fusion集显处理器产品还无法赶上独显的性能,但是毕竟他们已经迈出了第一步,而且就Llano面向的低电压笔记本,上网本和主流台式机市场而言,这样的性能水品也已经足够。不仅如此,AMD还有更多隐而未发的杀招。

    尽管目前Bulldozer处理器还没有采取集显设计,但是其浮点单元的设计则显得较为简单,可见他们很有可能在下一代架构设计中将浮点运算部分完全交由外置显卡或整合GPU来处理,而GPU在浮点运算方面的性能优势是一般CPU难以比肩的。在这种思想的指引下,未来的应用程序将能主动识别最适合用于处理当前运算任务的CPU或GPU核心,并自动将这些任务分别交给它们来处理。而这种发展策略显然是对GPU技术的掌握程度稍逊一筹的Intel所害怕的。■    

0人已赞

关注我们

泡泡网

手机扫码关注