時代在變。
十年前,英國《經(jīng)濟學人》曾用以工業(yè)用電量為主的一套指標來評估中國GDP,并將其命名為“克強指數(shù)”。
今天,中國經(jīng)濟實力最強的北上廣深等大城市都在全力比拼一個新的指標——計算力。因為在數(shù)字經(jīng)濟時代,這個指標將決定它們在未來城市大戰(zhàn)中的生死。
甚至,像安慶這樣的三四線城市,也在“著急上火”,因為慢一步,就會被狠狠甩在身后。
自從1946年,馮·諾依曼發(fā)明第一臺電腦ENIAC以來,算力一直在突飛猛進。
半個世紀前,第一次將人類送上月球的阿波羅11號飛船,其所搭載的電腦,CPU主頻只有0.043 MHz。
今天,任何一部普通的手機,主頻都在2500MHz以上,是登月電腦的5萬倍!
即便如此,仍無法滿足人們對算力的需求。
在IDC/EMC發(fā)布的一份報告中,最近十年來,全世界算力的增長遠遠滯后于數(shù)據(jù)的增長。
導致這一算力瓶頸的,是兩場革命:一個是互聯(lián)網(wǎng)革命,另一個是AI革命。
互聯(lián)網(wǎng)讓更多設備聯(lián)接在一起,未來,物聯(lián)網(wǎng)(IoT)還將帶來千億級的設備接入。海量的設備,疊加復雜的應用場景,引發(fā)數(shù)據(jù)大爆炸。
1992年,全人類每天只產(chǎn)生100GB數(shù)據(jù)。而今天,全球70億人,每人每天產(chǎn)生的數(shù)據(jù)高達1.5GB。僅一輛自動駕駛汽車,一天就能產(chǎn)生64TB數(shù)據(jù),足以填滿32塊硬盤。
爆炸式增長的數(shù)據(jù),哺育了人工智能(AI),使得深度學習等過去難以實踐的各種算法,得以喂養(yǎng)、訓練,并大規(guī)模應用。
這反過來,對算力提出巨大的需求。
2012年,谷歌大腦為了從1000萬張圖片中識別出一只貓,整整動用了1000臺電腦、16000個CPU。
今天,我們所面對的場景和需求,遠比識別一張圖片更復雜、多樣化。從VR/AR到無人駕駛,從工業(yè)機器人到遠程醫(yī)療……AI正改變我們的生活。
而它背后的算力支撐,也從云到邊緣,到設備端,變得無處不在。
19世紀70年代,發(fā)電機的問世催生了第二次工業(yè)革命。電力成為驅(qū)動全球經(jīng)濟發(fā)展的強大動力,人類由此邁進電力時代。
一百多年后的今天,算力正變得跟電力一樣觸手可及。未來,在數(shù)字經(jīng)濟時代,誰掌握更強的算力,誰就將擁有世界。
來自羅蘭貝格等國際權(quán)威機構(gòu)的數(shù)據(jù)顯示,在全球各國總算力的排行榜上,中美兩國遙遙領(lǐng)先。緊隨其后的,也都是英、法、德、印、日等經(jīng)濟強國。
算力不但是衡量國家實力的指標,也正在中國各大城市間引發(fā)一場熱戰(zhàn)。
從北上廣深到杭州、南京……大家都憋著一股勁兒,建設數(shù)字經(jīng)濟城市,爭當算力之都。就連安慶這樣的三四線城市,也在拼命學習、追趕。
上世紀90年代,公路、鐵路、電力等舊基建,奠定了中國制造業(yè)大國的地位。
而今,圍繞城市間的算力之爭,一大批集約化的大型數(shù)據(jù)中心正拔地而起。這背后,是一場規(guī)??涨暗男禄ㄟ\動。
在這場運動中,算力正取代電力,成為新基建的核心。因為算力,是數(shù)字經(jīng)濟時代的基礎設施,是新的生產(chǎn)力。
以傳統(tǒng)制造業(yè)為例,在算力上每投入1美元,可帶來10美元的產(chǎn)出。
未來,隨著新基建的大規(guī)模落地,算力的提升將為各行各業(yè)帶來質(zhì)的飛躍,并筑起中國數(shù)字經(jīng)濟的新底座。
一方面,數(shù)據(jù)大爆炸和人工智能對算力提出前所未有的需求。另一方面,傳統(tǒng)的計算架構(gòu)卻走進了死胡同。
過去數(shù)十年,全球算力基本上是CPU一家獨大。
尤其1978 年,英特爾推出x86架構(gòu)以來,CPU的算力更是以摩爾定律——每隔18個月翻一倍的速度,突飛猛進。
然而近年來,隨著半導體工藝制程逼近極限,CPU算力的增長也漸趨平緩。曾經(jīng)推動全球計算產(chǎn)業(yè)大發(fā)展的CPU,如今正陷入算力瓶頸。
21世紀頭十年,研究人工智能的科學家們曾到處尋找一種高效且低成本的算力,以便幫他們完成大吞吐量的數(shù)據(jù)處理,訓練算法。
最終,他們大多數(shù)選擇了英偉達的GPU,而不是英特爾的CPU。
原因是,這種非x86架構(gòu)的圖形處理芯片,擁有動輒幾百個內(nèi)核,能夠并行地同時處理數(shù)千個線程。
正是這批人,用GPU推動了一場人工智能革命。
作為這場革命的引領(lǐng)者,谷歌大腦之父吳恩達后來重新做了一次識別貓臉的實驗,結(jié)果只用了16臺電腦、64個GPU,比用CPU整整節(jié)省了近百倍。
GPU只是一個縮影,它反映出的是近年來一個迅猛增長的計算趨勢:
傳統(tǒng)CPU一家獨大的格局正在終結(jié),全世界正迎來一個新的異構(gòu)計算時代。
在這個新的計算時代,各種非x86架構(gòu)的算力百花齊放,以滿足復雜場景下,對算力更加多樣化的需求。
比如,F(xiàn)PGA和ASIC。
此前,無論CPU還是GPU,都屬于通用芯片,它們基于半個多世紀前的馮·諾依曼結(jié)構(gòu)設計,可勝任大多數(shù)的通用計算場景。
但這種基于指令集的計算架構(gòu),需要在內(nèi)存和處理單元間傳輸數(shù)據(jù),不但影響了效率,還增加了功耗。
FPGA和ASIC不同,它們是一種專用芯片,沒有指令集,也無需共享內(nèi)存,而直接以并行和流水線的方式處理數(shù)據(jù)。不但速度快,功耗也低得驚人。
當然,代價也不菲。由于是專用芯片,它們只能用于特定目的。其中,ASIC完全針對客戶定制;而FPGA屬于半定制,現(xiàn)場可編程,可重復使用。
自從1985年,賽靈思(Xilinx)創(chuàng)始人羅斯·弗里曼發(fā)明FPGA以來,這種芯片已廣泛用于許多要求低時延的場景。
比如,5G通信基站和自動駕駛,后者幾毫秒的剎車時延就可能致命。還有金融市場高頻交易、軍用導彈制導系統(tǒng),等等。
不僅如此,今天,F(xiàn)PGA正與GPU一起,成為全球高性能計算(HPC)和大型數(shù)據(jù)中心的加速器。
前者以速度取勝,后者擅長大吞吐量數(shù)據(jù)處理,它們?nèi)缤说乃闹?。CPU則形同大腦,負責統(tǒng)籌、調(diào)度各種計算資源。
2010年以前,微軟必應(Bing)搜索引擎基本上靠CPU驅(qū)動。
但大數(shù)據(jù)和人工智能時代的到來,讓傳統(tǒng)設備不堪重負。最終,微軟不得不用FPGA來加速計算。
結(jié)果,無論數(shù)據(jù)吞吐量,還是延遲,都得到10倍級的提升。
如今,微軟已在自家數(shù)據(jù)中心、一半以上的服務器部署了FPGA加速卡。亞馬遜、IBM等全球科技大佬也紛紛入局。
就連英特爾,也顧不上身段,斥資167億美元,收購了全球第二大FPGA芯片制造商Altera,試圖續(xù)寫神話。
谷歌則基于ASIC架構(gòu),開發(fā)了一款專門用于加速神經(jīng)網(wǎng)絡計算的TPU芯片。
眾多非x86架構(gòu)的芯片,共同托起了一個嶄新的計算時代。
20年前,人類進行一次全基因組測序,需要數(shù)年之久,現(xiàn)在只需要1天。在這背后,是成千上萬倍的算力提升。
新計算時代,給人類帶來的遠不止算力的提升。
在算力需求還不大的年代,功耗并非大問題。但如今,隨著全球HPC和大型數(shù)據(jù)中心的興建,高耗能正成為一個棘手問題。
另一方面,手機等小型終端設備,也對續(xù)航和功耗,提出越來越苛刻的要求。
傳統(tǒng)CPU,無論硬件設計還是軟件設計,功耗都不占優(yōu)。硬件層面,同等算力下,采用流水線設計的ASIC和FPGA,功耗比CPU低很多。
軟件層面,x86 CPU采用復雜指令集,與采用精簡指令集的ARM等芯片比,功耗天生就吃虧。
由此可以預計,未來ARM、FPGA、ASIC等低功耗的綠色計算,將大行其道。
多元化的格局,也為全人類提供了一種更安全的計算,同時避免對某種單一計算架構(gòu)的過度依賴。
從這個意義上講,未來的計算將滿足四個特征:異構(gòu)、集約化、綠色和安全。
這樣一個新計算時代,對今天的中國意義尤其深遠。
1882年9月4日,愛迪生親手合上世界上第一個商用電力系統(tǒng)的電閘,電流沿電線從珍珠街電站流向曼哈頓金融區(qū),照亮大半個紐約。
4年后,西屋電氣創(chuàng)始人威斯汀豪斯又建造了美國第一個商用交流電電力系統(tǒng)。
一輪接一輪電力大基建,使得美國人率先開啟了電氣時代,并為美國經(jīng)濟注入強勁動力。最終,美國取代歐洲,成為新的世界中心。
一百多年后,隨著數(shù)據(jù)大爆炸,算力正成為驅(qū)動經(jīng)濟的新動力。
在中國,12.9億手機用戶、近1億個體戶和2000多萬家企業(yè),每天都要靠算力來完成各種線上線下交易。
這背后,每年高達數(shù)十萬億元的電商交易,要通過云端的算力來處理。
不僅如此,算力還支撐著從VR/AR到自動駕駛,從人工智能到工業(yè)互聯(lián)網(wǎng)……所有我們生活中的新科技、新產(chǎn)業(yè),正在改造著傳統(tǒng)產(chǎn)業(yè)的面貌。
因為有了更強的算力,智慧工廠、智慧農(nóng)場、智慧交通、智慧醫(yī)療、智慧政務……不斷從理想變?yōu)楝F(xiàn)實,并由此帶來更高的效率和更高的產(chǎn)出。
在美國,隨著智能機器人等基于智能計算的新技術(shù)不斷應用在傳統(tǒng)制造業(yè),未來預計將為美國制造業(yè)帶來 1700 億美元的額外產(chǎn)出。
與此同時,智能電網(wǎng)的大規(guī)模建設,將為其帶來1.3—2萬億美元的收益。
因為算力對經(jīng)濟的這種強大驅(qū)動力,全世界正掀起一場大規(guī)模的新基建。在中國,新基建更是已上升至國家的發(fā)展大戰(zhàn)略。
從5G、特高壓、高鐵、充電樁,到AI、大數(shù)據(jù)中心、工業(yè)互聯(lián)網(wǎng)……七大領(lǐng)域,背后都需要算力作支撐。
也因此,短短數(shù)年,全國各地掀起一場以興建大數(shù)據(jù)中心為代表的算力大比拼。
北京、杭州、深圳、上海,你方唱罷我登場。就連昔日偏遠的貴州,也憑借華為、蘋果、騰訊等公司的大數(shù)據(jù)中心落地,上演了一場GDP逆襲。
在這些大數(shù)據(jù)中心里,x86的CPU架構(gòu)不再一統(tǒng)天下,各種異架構(gòu)芯片“捆”在一起,共同為社會輸出算力。
過去,華為的算力以x86為主,如今它面向端、邊、云,提供一種鯤鵬+昇騰+CPU+GPU+NPU的多樣性算力,并圍繞鯤鵬形成了一個產(chǎn)業(yè)鏈。
阿里平頭哥,則基于RISC-V指令集,開發(fā)了自己的AI芯片——含光800。
擅長人工智能的百度,也在多年部署FPGA加速器的基礎上,打造了昆侖AI芯片。
在國家七大超算中心,國產(chǎn)自研的申威26010處理器正在支撐著全世界僅次美國的最強算力。
一個動力充沛、多樣性的算力時代正在來臨。
未來,這個新的算力時代不但將催生一個萬億級產(chǎn)業(yè),更將通過新基建,源源不斷地為中國經(jīng)濟注入澎湃的動力。