6月23日,鯤云科技在深圳的產品發布會發布全球首款數據流AI芯片CAISA,其定位于AI終端推理,目前已完成量產。
根據官方介紹,CAISA搭載了四個CAISA 3.0引擎,具有超過1.6萬個MAC(乘累加)單元,峰值性能可達10.9TOPs。該芯片采用28nm工藝,通過PCIe 3.0×4接口與主處理器通信,同時具有雙DDR通道,可為每個CAISA芯片提供超過340Gbps的帶寬。
鯤云援引第三方數據顯示,搭載CAISA芯片的加速卡僅擁有英偉達同類產品 1/3的峰值算力,但是其通過95.4%的芯片利用率可以實現3倍左右的的實測性能。
大部分廠商的AI芯片均為指令集的計算架構,此次鯤云科技發布的CAISA芯片則為數據流架構。鯤云表示,數據流架構AI芯片提供較之于指令集架構AI芯片更高的計算效率。指令集的計算架構要求芯片的計算和控制是分離的,而控制過程中模塊間的數據移動以及數據計算的過程中會存在等待周期,這會使得芯片的計算模塊存在閑置情況,這也是現有芯片利用率普遍低于30%的原因。而數據流架構依托數據流流動次序控制計算次序,采用計算流和數據流重疊運行方式消除空閑計算單元。在實測中,數據流芯片可以與同峰值算力的指令集芯片表現出更高的芯片利用率以及更高的實測算力。
本次發布會鯤云科技也帶來了AI計算平臺星空加速卡X3以及X9。
星空X3加速卡是搭載單顆CAISA 芯片的數據流架構深度學習推斷計算平臺,為輕量化規格,X3加速卡因此可以與不同類型的計算機設備進行適配,包括個人電腦、工業計算機、網絡視頻錄像機、工作站、服務器等。基于CAISA芯片的X3加速卡動態功耗為20W左右。英偉達邊緣端旗艦產品Xavier 在深度學習網絡ResNet-50, YOLO v3中實測獲得的芯片利用率分別為21.1%、6.8%,而星空X3加速卡的結果為92.3%及82.4%,遠高于前者。總體算力表現可以達到Xavier的1.48-4.12倍。
星空X9加速卡為搭載4顆CAISA 芯片的深度學習推斷板卡,峰值性能43.6TOPS,主要滿足高性能場景下的AI計算需求。實測性能方面,X9在ResNet50可達5240FPS,與T4性能接近,在YOLO v3、UNet Industrial等檢測分割網絡,實測性能相較T4有1.83-3.91倍性能提升。最優實測性能下,X9處理延時相比于T4降低1.83-32倍。
盡管數據流架構顯著的提高了芯片算力的利用率,但是指令集的架構支持各式各樣的數據組合,具有較強的通用性。CAISA目前工藝水平為28nm,這在晶體管數量、處理速度、溫升等方面較之于更加先進工藝的芯片將會存在的劣勢。
鯤云科技認為此次發布的芯片新品的核心競爭力在于提供了更高的算力性價比。
AI芯片產品不同于SaaS等其他企業服務賽道,用戶衡量產品的好壞與否,基本是通過芯片的計算能力、通用性以及價格來進行判斷。CAISA芯片的競爭路線不是依靠更大的芯片面積和制程工藝提供更高的峰值算力,而是通過數據流動控制計算順序來提升實測性能。
終端推理芯片賽道上,頭部廠商英偉達也部署了邊緣側Xavier芯片以及云端旗艦加速卡T4。鯤云科技創始人兼CEO牛昕宇告訴36氪,芯片賽道的競爭是簡單直接的,要素無非就是算力性價比、通用性以及遷移成本。用戶會根據自己的算力需求進行產品篩選,然后比對價格。峰值算力的提升往往來自于工藝技術的迭代以及更大的芯片面積,這也就意味著更高的產品成本。但是此次鯤云CAISA架構帶來的芯片利用率提升,并不需要更高的峰值算力從而讓用戶獲得更高的實測算力體現,這可以減少企業所需的制造成本。
值得關注的是,英偉達憑借其極強的峰值算力以及軟件生態構建了極高的競爭壁壘。除了產品在算力上的優勢,英偉達憑借產品積累擁有極強的軟件生態,現有用戶的轉換芯片的成本較高。牛昕宇表示,也許初創企業可以選擇其他進行拓展,CAISA帶來的數據流架構也許就會是下一個方向。
此外,鯤云將會為用戶配備RainBuilder編譯工具鏈,可以支持從算法到芯片的端到端自動化部署,用戶和開發者無需了解架構的底層硬件配置。RainBuilder可自動提取主流AI開發框架(TensorFlow,Caffe,Pytorch,ONNX等)中開發的深度學習算法的網絡結構和參數信息,并面向CAISA結構進行優化。鯤云希望借助編譯工具鏈提供用戶較為方便的部署環境,同時也能完成較為低成本的算法遷移。
2017年鯤云科技獲得Pre-A輪投資時,此時鯤云科技正致力于研發本地化人工智能芯片平臺,并在衛星遙感、電力、智慧城市等垂直領域進行落地。目前,鯤云科技已經完成了天使輪,Pre-A輪及A輪融資,設有深圳、山東、倫敦研發中心,2019年于山東成立人工智能研究院,支持技術在各垂直領域的實際落地。
鯤云科技目前已經與戴爾及其他廠商達成戰略簽約,在AI加速計算領域進行合作。其核心產品星空加速卡已發力于電力、教育、智能制造、智慧城市等領域。
企業們往往會首先從細分領域切入,并構建自己的垂直生態圈。鯤云已經在工廠智能安監進行了產品落地,也與能源型企業達成合作。AI視覺在AI應用市場份額占比較大,智慧城市、安防、智能工廠等領域均需要AI視覺,人工智能視覺芯片將是鯤云的著重發力點。
終端推理賽道上,寒武紀推出應用于手機終端、AI終端的第三代芯片1M ;華為海思也推出昇騰310應用于AI終端,麒麟900應用于華為手機;地平線則分別上線XForce邊緣AI計算平臺以及征程應用于安防以及自動駕駛場景;比特大陸以CPU技術路線推出BM1880應用于安防場景。
鯤云科技表示,公司已于2018年8月完成了一筆數千萬的A輪融資,公司近兩年的發展方向將會是基于CAISA芯片的落地以及拓展。現階段鯤云科技團隊共70余人,主要以研發人員為主,公司目前有拓展服務人員從而適配產品落地的計劃。2020年鯤云科技已經有近千萬元人民幣的訂單量,伴隨著新品的上線,預估將會有新的營收增長階段。
本文轉載自:https://36kr.com/p/765514389393283
提供下一代計算平臺,加速人工智能落地
聯絡我們:contact@corerain.com
銷售聯絡:sales@corerain.com
媒體合作:media@corerain.com
展會合作:events@corerain.com
深圳 | 深圳市福田區保稅區市花路長富金茂大廈14層(總部)
上海 | 上海市閔行區龍湖虹橋天街A棟608A
濟南 | 山東省濟南市濟南市高新區旅遊路8661號高科技創新園5號樓9層
西安 | 陝西省西安市碑林區大差市十字西南角1幢1單元10503室 (萬達新天地)
廣州 | 廣東省廣州市番禹區鍾村街鍾二村鍾漢路13號星光薈直播小鎮508A
杭州 | 杭州市江干區錢江新城城星路98號迪凱城星國際A座27樓