CPU性能發展的三個階段
AMD高級副總裁兼技術事業部總經理Chekib Akrout先生近日專程來華,介紹了AMD未來一兩年內的產品與技術發展規劃,而這其中的重點就是AMD一直所在推崇的融聚技術(Fusion)以及新一代的x86核心,相較而言,2010年的多核產品線并不是Chekib Akrout介紹的重點,由此可以看出AMD對于2011年的重視,并也預示著2010年將是多核與GPU/CPU核心異構混合的分水嶺,意義重大。

AMD高級副總裁兼技術事業部總經理Chekib Akrout先生

在AMD看來,CPU性能的發展正在進入第三個階段,即異構系統時代,前兩個階段分別是單核心與多核心時代
對于CPU的三個發展階段,Chekib Akrout表示,第一個時代我們稱之為單核時代,一切重點都是放在主頻頻率,希望它越來越快,性能越來越強。但隨著功耗和復雜性要求越來越高,它已處于飽和狀態。為了進一步解決增加性能的問題,我們進入到一個多核時代,在多核時代,我們希望可以增加很多內核,這樣每個核就可以給我們帶來更多性能的提升。但由于復雜性不斷提高,這個時代也慢慢飽和。比如一個四核處理器,一般情況下有時候只是第一第二核工作時間多,第三、第四核并不工作。
而現在AMD所在做的事情,就是進入第三階段,異構系統時代。Chekib Akrout指出,在這個時代我們增加了很多不同的計算單元,希望能夠提高性能,希望獲得很多數據并行,但它需要很多的計算單位,編程成為最大的制約因素。在這個新時代中,AMD處于曲線開端,因此(有很大的發展空間)今后將會給我們帶來更多提高性能的機會。
AMD的融聚產品規劃與優勢
在介紹完CPU的發展階段后,我們可以再從工作量上看看CPU與GPU的應用。縱觀當前的客戶應用形態,在視頻、圖形計算工作的負載方面,視頻用得比較多。舉個例子,現在視頻已經占了整個互聯網用戶三分之一的流量。AMD如何通過自己的融聚技術滿足目前大家所需要的現代工作負載要求呢?首先我們有x86技術,還有GPU技術。我們知道x86技術現在已經非常成熟,用于CPU的軟件產品也非常成熟。所有的編程人員都知道如何根據它進行編程,同時有非常好的程序序列。從GPU來講,也非常出色,負載優化,兩者結合才使我們迎來了融聚時代。

AMD的APU戰略構想,以CPU為基礎,融合進GPU巨大的并行計算能力,從而滿足未來的緊湊、小巧、低功耗、高性能的用戶需求
那么,有了CPU和GPU,如何結合起來打造融聚技術呢?GPU是針對固定功能,主要是圖形處理。但隨著技術不斷發展,也越來越有可編程性。CPU本身就具有很高的可編程性,隨著演變發展,也可以承擔一些GPU的工作。當我們的GPU編程性越來越高,當CPU密度越來越大,就有可能把兩者結合起來,Chekib Akrout強調,這就是去年年底AMD為什么宣布了第一款融聚技術,我們稱之為LIano。有了這種集成能力,我認為CPU、GPU不斷密切配合,就可以獲得更大的計算密度。有了非常好的計算密度,我們就可以搞出非常好的編程模型,讓開發人員開發出新的應用,充分利用我們的架構。

AMD的APU未來規劃,簡而言之,APU就是集成了CPU與GPU優勢的產物
現在有了異構計算環境,那么如何打造融聚計劃呢?我們知道CPU越來越定制化,GPU的密度非常大。目前GPU開發速度一般比CPU開發速度快一些,GPU有時候一年可以推出新產品,而CPU通常要一、兩年的時間。Chekib Akrout再次強調——為了進一步向前推進我們的融聚技術和APU技術,必須有最好的CPU和GPU技術,目前只有AMD才兼有這兩種技術。對于這一點,并不難理解,筆者也基本認同。英特爾的CPU實力很強,但GPU方面還沒有拿得出手的高性能產品。NVIDIA在GPU方面很強,其CUDA核心與編程架構,在HPC(高性能計算)領域還是很出名的,不過由于沒有CPU產品線,NVIDIA的方案也必須建立在英特爾或是AMD的CPU平臺上,畢竟GPU現在還不能當CPU使,運行操作系統。而且,在DX11時代,NVIDIA的進度也明顯落后于AMD。所以,現在如果要拿出最好的CPU與GPU核心進行整合,也只有AMD能做到了。

AMD融聚技術產品設計方法,在設計之初就將CPU的IP核與GPU的IP核進行統一的考慮,并通過新一代的統一融聚內存控制器來滿足具體的數據請求帶寬,并設計出最終的APU
說到這,可能有些讀者會問,英特爾不是已經有了這種所謂的CPU+GPU的整合產品了嗎?那么AMD的APU的優勢又體現在哪里呢?其實,只要看看兩者的架構,就能明顯看出其中的不同。

英特爾目前已經推出了集成GPU的32nm的Clarkdale處理器(隸屬Westmere家族),它通過MCP(多芯片封裝)技術,將CPU單元與GPU單元封裝在一起,但并不是在一塊晶圓上原本設計的,而從內部的結構來看,內存控制器移到了GPU單元上,GPU與CPU采用MCP接口相連,顯然這與AMD的APU設計理念完全不同,這種設計雖然保證了GPU的效率,但對于CPU的性能將會產生較大的影響,這也就是“非原生”設計的一大弊病,并不能充分發揮CPU與GPU整合的威力。英特爾推出這款產品的本意其實更注重于平臺成本的節省,而不是性能的提升

AMD的APU設計,從整合上看就是一體的,GPU與CPU在這里可以看做是不同的處理單元,而對外的接口,包括內存以及I/O則是統一的,這就意味著GPU與CPU核心可以共享內存和I/O地址空間,這對于編程和系統優化來講,是非常誘人的。即使是數據傳輸效率,也提升明顯。比如在以往的架構中(左上角),GPU要訪問主內存中的數據,需要走PCI-E總線經北橋與CPU溝通,CPU再把內存數據發送給GPU,這樣的操作效率可想而知,而在APU中,CPU與GPU單元的尋址可以在APU內部進行調度,效率明顯提高。相比之下,英特爾的Clarkdale處理器雖然也集成了GPU芯片,但從尋址方式上仍然是傳統的,效率方面不可同日而語
不過,GPU與CPU的融合有一個巨大的挑戰就是能耗的管理和散熱設計,對此Chekib Akrout表示認同,這也是AMD目前的研發重點,而大體的做法和CPU的能耗管理方法差不多,即不用的核心與功能單元就休眠,要用到時才重新打開,不過這涉及到對GPU多核心的精細調整與控制。
在介紹完CPU和GPU架構融合之后,現在要看看軟件編程。我們知道有了CPU、GPU,就可以根據不同的線程決定去向,如果按序列進行就往CPU走,如果需要并行就往GPU走。實際上OpenCL和DirectX Compute都是旨在CPU和GPU的并行開發,這也是支持融聚技術發展的第一步。

AMD的融聚產品在軟件編程方面,主導兩個標準,即OpenCL與DirectX Compute,在這兩者中,AMD都是積極的標準制作的參與和貢獻者,而AMD自己的Stream SDK也將向業界標準靠攏
現在我們看看軟件堆棧,最底下的是硬件,再上面是OpenCL和DirectXCompute,可以讓設計人員充分利用我們的架構做工作。再上面的堆棧是所謂的中間件、編譯器、調試器、剖面儀等等,可以讓技術人員在不需要了解我們技術特性的情況下,繼續開發新的內容。有了軟件堆棧后我們就要對負載進行非常好的平衡。Chekib Akrout表示,從目前來看,只有AMD公司才有最佳的CPU、GPU軟件堆棧和硬件,并幫我們把CPU和GPU的負載平衡起來。

AMD所設想的異構計算的軟件生態系統,可以看出基礎的硬件核心就是AMD的融聚產品,那當然也包括獨立的CPU與GPU所組成的系統,再往上就是標準化的OpenCL與DirectX Compute通用編程環境,在此基礎上開發者來開發面向用戶的最終應用,而這些應用也將具備CPU與GPU負載均衡的能力
在介紹中,我們能感覺到AMD對于OpenCL和DirectXCompute的看重,而自己的Stream SDK已經放到相對次要的位置,這與NVIDIA大力宣傳自己的CUDA編程架構有了明顯不同。因此Chekib Akrout一直在強調在編程環境方面的開放性,在他看來,CUDA雖然很強大,但是一個封閉的環境,而開放的環境則對于用戶更為友好,因此AMD也積極的加入到這兩個標準的開發中。這么說其實并不難理解,畢竟OpenCL和DirectX Compute其實已經是APU能否成功的一大關鍵所在。
新一代的x86核心 高端與APU模塊兩手抓
在介紹完APU的理念與未來的設計構想之后,Chekib Akrout又介紹了AMD推出的兩款最新的x86核心。一個是Bobcat主要是低功耗、低成本,瞄準低端市場的產品。另一個則是Bulldozer,它針對的是高性能、可擴展性比較高的市場,主要面向主流客戶和服務器市場。
下面為大家介紹一下Bobcat,Bobcat這種核心非常小巧、高效,而且功耗非常低,能夠在低于一瓦的情況下工作。Bobcat以不到目前處理器核心一半的面積實現了當前主流處理器90%的性能。這款核心將在2011年隨著我們代號為Brazos的筆記本APU問世而同時問世。它的設計非常靈活,高度可合成,可重新組合CPU使用。

Bobcat核心示意圖,采用極低功耗設計是它的重點,并且是面向APU的CPU架構設計,便于模塊化的融合,而它的第一個應用場合就是面向筆記本電腦市場的APU——Brazos平臺
而另一款高端處理器核心Bulldozer,而是面向高性能應用市場。通過緊密相連的兩個核心共享資源,從而極大的提高了效率。Bulldozer每條并行的線程獨享一個專用的整數核心,具有可獨享或共享的浮點單元,并共享緩存。另外,在處理器的生產技術中采用了高K金屬柵級的32納米SOI技術,2011年上市,在臺式機和服務器上使用。Bulldozer有兩個執行單元,但可以共享一個浮點的調度程序,使它可以更好地對資源進行優化。


我們可以從以上兩張圖上能看出AMDAPU的發力點,2011年將在高端桌面市場推出基于Bulldozer核心的Scorplus平臺,屆時的CPU成品代號Zambezi,而在主流桌面市場將推出Lynx平臺,采用的就是LIano處理器,而在高端的筆記本電腦市場,將推出Sabine平臺,采用的也是LIano APU,在超輕薄與上網本市場上則推出Brazos平臺,采用的也是APU,代號為Ontario,CPU核心就是Bobcat。不過我們還不清楚LIano所采用的CPU核心(共4個核心)還不知道具體的版本,很可能是現有的Phenom核心的演進版
從AMD的未來規劃中,我們也能發現,在面向高端應用場合,仍然是以純CPU為主導,APU更多的是面向消費類市場。這是因為,消費類市場的應用與APU的優勢相吻合,比如視頻、動畫、3D等多媒體應用是消費類市場的主流,在這里APU肯定就有大量的用武之地,而現在的OpenCL與DirectX Compute也主要是面對這一市場,在企業級市場上,傳統的企業級應用,如ERP、CRM、E-Mail、Web服務、數據庫等等,由于不是大規模的并行應用,所以APU的加速功能可能還不如更多核心的純CPU快。所以這也是為什么AMD對于企業級市場和高端桌面市場先推出基于Bulldozer核心的純CPU的原因,而Chekib Akrout也表示,再往后,AMD肯定會推出以Bulldozer核心為基礎的企業級APU,當然屆時的企業級應用的APU生態環境也必然相對的成熟很多。
不過,Chekib Akrout強調,LIano也將會有企業級產品,它將面向云計算,因為云計算所涉及到的數據處理內容也包羅萬象,而多媒體也將是云計算中重要的內容類別,而這正是APU的強項,所以APU在企業級方面最先的發力點將是云計算。
Chekib Akrout最后總結到,AMD為現代的工作負載提供合適的產品,包括視頻、圖形處理。AMD在APU方面具有影響深遠的遠見,因為我們認為APU就是未來計算的代表。融聚技術和異構計算環境,不僅僅只關乎硬件,其中還涉及軟件。我們不僅有非常好的GPU路線圖可以不斷推向市場,同時還有最好的x86內核技術!
進入論壇>>聲明:IT商業新聞網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內容僅供參考。新聞咨詢:(010)68023640.推薦閱讀
可見,在不遠的將來,人們利用iPad或其他的電子閱讀器就可能“搞定”生活中的一切。 從2010年秋季學期開始,美國一些高等院校將嘗試采用iPad來進行教學活動。業內人士認為,這不僅是利用高科技促進教育事業的一次嘗試>>>詳細閱讀
本文標題:AMD:2011年是融聚元年!
地址:http://www.sdlzkt.com/a/xie/20111230/194537.html

網友點評
精彩導讀
科技快報
品牌展示