0
| 本文作者: 呂倩 | 2017-09-13 17:57 |
科幻小說《三體》里,世界上最快的計算機,運算速度達到100萬億次。而如今的機器計算力,已達到500萬億次,阿里云高性能計算研發(fā)負責人何萬青博士表示,由此可見,科學幻想在機器計算方面,已經(jīng)是很落后的了。
現(xiàn)實世界中,高速發(fā)展的計算力正推動著人工智能產(chǎn)業(yè)更大規(guī)模地爆發(fā)。
9月12日,阿里云異構(gòu)計算家族首次亮相,推出全新一代異構(gòu)加速平臺——涵蓋GPU、FPGA在內(nèi)等6款異構(gòu)實例,可滿足從圖形渲染到高性能計算及人工智能等復雜應用的計算需求。特別是在人工智能領(lǐng)域,可將深度學習成本縮減一半,大幅降低人工智能計算門檻;而基于阿里云異構(gòu)平臺的全新高性能計算實例E-HPC,可一鍵部署獲得媲美大型超算集群環(huán)境的“云上超算中心”。
這是繼企業(yè)級ECS家族全線升級后,阿里云再次在企業(yè)級市場推出專業(yè)服務,將異構(gòu)計算的使能領(lǐng)域從人工智能擴大到更廣的計算需求領(lǐng)域。
據(jù)雷鋒網(wǎng)了解,新品具備更強的并行能力和多場景支持,不僅全力支撐人工智能計算力升級需求,也為圖形計算、生命科學、材料力學、分子動力學等科研計算領(lǐng)域提供普惠計算能力。
而此番推出的異構(gòu)計算加速平臺,阿里云異構(gòu)計算負責人張獻濤對雷鋒網(wǎng)表示,主要為了進一步完善人工智能產(chǎn)業(yè)生態(tài),滿足更多客戶的核心業(yè)務需求。

1、
阿里云此次推出適用于深度學習在線推理(Inference)的GPU實例GN5i,采用了英偉達 Pascal架構(gòu)P4圖形處理器,提供最大45Tops INT8整型計算能力和11TFlops FP32單精度浮點計算能力。可根據(jù)深度學習計算力的要求,進行GPU實例的“Scale-out”水平擴容或“Scale-up”垂直變配,分鐘級即可完成實例的創(chuàng)建。阿里云內(nèi)部人士透露,下半年,還將推出搭載目前性能最強GPU V100的高性能GPU實例,大幅提升深度學習的處理效率。
據(jù)阿里云高級技術(shù)專家龍欣介紹,在面向AI深度學習在線推理場景時,GN5i實例依托專有推理型GPU和阿里云高性能SSD云存儲和OSS存儲服務,在滿足數(shù)據(jù)處理IO的基礎(chǔ)上,時延最低可達微秒級;另外,GN5i可一鍵部署TensorFlow、Caffe等主流深度學習框架,提供智能調(diào)度、自動運維、實時擴容等服務,有效降低人工智能在線服務成本50%以上。
作為異構(gòu)計算近些年來的新寵,功耗低、實時性強的FPGA普遍被業(yè)界看好,提供云上基于FPGA的高效靈活場景化并行計算能力,已成為公共云的基礎(chǔ)服務。
2017年初,阿里云推出基于英特爾Arria 10芯片的FPGA計算實例,已幫助大量用戶通過自定義加速算法,實現(xiàn)云上FPGA加速業(yè)務的一鍵部署、快速研發(fā)和彈性伸縮,有效提升了人工智能及深度學習的效率,為企業(yè)節(jié)省成本。
而此次發(fā)布的F2實例基于賽靈思Xilinx KU115器件,提供145萬邏輯門電路,單實例的單精度浮點計算性能可達1.5TFlops。隨著集成英特爾(F1)和賽靈思(F2)芯片的FPGA計算實例相繼面世,阿里云率先完成對主流FPGA方案的全覆蓋,成為全球FPGA領(lǐng)域產(chǎn)品線最全、場景最多的公共云服務商。再加上阿里云業(yè)已推出的FPGA鏡像市場,可幫助用戶完成更多定制化FPGA加速方案,提高特定業(yè)務和算法的效率。
相比GPU和CPU,F(xiàn)PGA更適合非標數(shù)據(jù)位寬的人工智能、金融分析、基因匹配、物聯(lián)網(wǎng)數(shù)據(jù)庫等領(lǐng)域。
龍欣對雷鋒網(wǎng)表示,阿里云針對非標準位寬場景做了大幅優(yōu)化,以物聯(lián)網(wǎng)時序數(shù)據(jù)庫為例,F(xiàn)2的處理效率可比CPU高30倍,為用戶大幅降低硬件加速時間和成本。“阿里云希望提供一個彈性、完善的FPGA開發(fā)環(huán)境,幫助用戶縮短開發(fā)周期,并以最低的成本、最大的靈活度在云端快速搭建完整的硬件加速服務?!褒埿辣硎?。

2、
針對傳統(tǒng)對高性能計算有強烈需求的高校科研機構(gòu)和企業(yè)用戶,阿里云異構(gòu)計算家族推出了彈性高性能計算實例E-HPC,這也是中國首個公共云上的HPC as a Service產(chǎn)品。
E-HPC基于阿里云異構(gòu)計算平臺在高性能虛擬化、并行計算、低延遲網(wǎng)絡和HPC軟件棧等方面的特性,幫助生命科學,氣象預報,石油勘探,工業(yè)設(shè)計和航空航天等領(lǐng)域的客戶,快速獲得高性能計算集群計算能力、調(diào)度能力和軟件能力,按需組建自己的“云上超算中心”,并可實現(xiàn)一鍵部署和彈性伸縮。
“如果把傳統(tǒng)超算中心比作‘珠穆朗瑪峰’,那么阿里云的E-HPC則是將高性能計算做更普惠的覆蓋,成為高性能計算的‘青藏高原’?!?阿里云資深專家何萬青打比喻稱。
實際上,阿里巴巴集團內(nèi)部很多業(yè)務是通過異構(gòu)計算取得非常好的計算加速效果,比如拍立淘、以圖搜圖、商品分類等,這些解決方案正通過阿里云對外輸出;再加上阿里云基礎(chǔ)設(shè)施在25G網(wǎng)絡、第三代分布式存儲、遍布全球的13個區(qū)域的數(shù)據(jù)中心及高可用骨干網(wǎng)等方面的不斷創(chuàng)新,可為人工智能提供高性能、彈性伸縮和業(yè)務永續(xù)的加速引擎。
除了產(chǎn)品層面,阿里云還提供了全方位的人工智能產(chǎn)業(yè)服務,包括智能語音交互、圖像/視頻識別、交通預測、情感分析等技術(shù)服務,這些技術(shù)正通過阿里云ET為客戶服務。過去一年,阿里云推出ET城市大腦、ET工業(yè)大腦、ET醫(yī)療大腦等行業(yè)垂直的人工智能系統(tǒng),將人工智能技術(shù)落地到產(chǎn)業(yè)中去。
一直以來,HPC市場都是相比封閉的,由傳統(tǒng)高校研發(fā)、運用、測試。在將這一傳統(tǒng)技術(shù)由線下搬到線上時,必然將會遇到諸多困難。對于這一點,何萬青對雷鋒網(wǎng)表示,放眼國際,很多原本做超算軟件的公司,如今都轉(zhuǎn)變?yōu)槌惴展荆峁┝怂^的“云連接”。但此“云連接”之下,究竟使用的是專用集群還是其他公有云,你是看不見的。
況且,何萬青表示,這個世界永遠是新的生產(chǎn)關(guān)系和新的活躍的進取的人,活水攪動死水。足夠積極得應對,才能把產(chǎn)業(yè)、行業(yè)做起來。
張獻濤則補充稱,云有自己的特點——彈性、多樣性——絕大部分數(shù)據(jù)中心有自己的特殊架構(gòu)設(shè)計和自己獨特的使用方法。阿里云所具備的彈性和靈活性,是可以與傳統(tǒng)超算中心進行差異化競爭的一個主要優(yōu)勢。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。