據(jù)相關(guān)媒體報(bào)道 ,中國(guó)芯片 90% 依賴進(jìn)口,過(guò)去十年累計(jì)耗資高達(dá) 1.8 萬(wàn)億美元。即便按照較低的匯率折算,也已經(jīng)遠(yuǎn)超 10 萬(wàn)億元人民幣。然而,這幾年中國(guó)的創(chuàng)業(yè)者和投資者都逐漸開(kāi)始關(guān)注 AI 芯片,有觀點(diǎn)認(rèn)為在這個(gè)新的芯片領(lǐng)域,中國(guó)可以說(shuō)和世界已經(jīng)在同一個(gè)起跑線上了。
據(jù)相關(guān)媒體報(bào)道 ,中國(guó)芯片 90% 依賴進(jìn)口,過(guò)去十年累計(jì)耗資高達(dá) 1.8 萬(wàn)億美元。即便按照較低的匯率折算,也已經(jīng)遠(yuǎn)超 10 萬(wàn)億元人民幣。然而,這幾年中國(guó)的創(chuàng)業(yè)者和投資者都逐漸開(kāi)始關(guān)注 AI 芯片,有觀點(diǎn)認(rèn)為在這個(gè)新的芯片領(lǐng)域,中國(guó)可以說(shuō)和世界已經(jīng)在同一個(gè)起跑線上了。
那么,中國(guó) AI 芯片中的玩家到底都有誰(shuí)呢?我們今天就來(lái)盤(pán)點(diǎn)一下。
中星微
早在 2016 年, 中星微 便宣布他們的中國(guó)首款“星光智能一號(hào)”嵌入式 NPU 已經(jīng)在當(dāng)年 3 月 6 日實(shí)現(xiàn)了量產(chǎn)。
據(jù)介紹,“星光智能一號(hào)”VC0758 采用了“數(shù)據(jù)驅(qū)動(dòng)”并行計(jì)算的架構(gòu),可以支持 Caffe、TensorFlow 等多種神經(jīng)網(wǎng)絡(luò)框架,支持 AlexNet、GoogleNet 等各類(lèi)神經(jīng)網(wǎng)絡(luò)。單顆 NPU(28nm) 能耗僅為 400 mW,極大地提升了計(jì)算能力與功耗的比例,可以廣泛應(yīng)用于智能駕駛輔助、無(wú)人機(jī)、機(jī)器人等嵌入式機(jī)器視覺(jué)領(lǐng)域。
不過(guò),業(yè)內(nèi)也有觀點(diǎn)稱這不是一個(gè)專(zhuān)為加速 Neural Network 而開(kāi)發(fā)的處理器,該觀點(diǎn)認(rèn)為其內(nèi)部集成了多個(gè) DSP 核(其稱為 NPU core),通過(guò) SIMD 指令的調(diào)度來(lái)實(shí)現(xiàn)對(duì) CNN、DNN 的支持,以這個(gè)邏輯,似乎很多芯片都可以叫 NPU。
地平線機(jī)器人
Horizon Robotics(地平線機(jī)器人)由前百度深度學(xué)習(xí)研究院負(fù)責(zé)人 余凱 創(chuàng)辦,致力于打造基于深度神經(jīng)網(wǎng)絡(luò)的人工智能“大腦”平臺(tái)-包括軟件和芯片,可以做到低功耗、本地化的解決環(huán)境感知、人機(jī)交互、決策控制等問(wèn)題。
2017 年底,該公司已經(jīng)發(fā)布了 面向智能駕駛的征程 (Journey)1.0 處理器和面向智能攝像頭的旭日 (Sunrise)1.0 處理器 。這是完全由地平線自主研發(fā)的人工智能芯片,采用地平線的第一代 BPU 架構(gòu)——高斯框架,具有全球領(lǐng)先的性能: 可實(shí)時(shí)處理 1080p@30 視頻,每幀中可同時(shí)對(duì) 200 個(gè)目標(biāo)進(jìn)行檢測(cè)、跟蹤、識(shí)別,典型功耗 1.5W,每幀延時(shí)小于 30ms。
寒武紀(jì)
2016 年,寒武紀(jì)科技于北京中關(guān)村和上海臨港注冊(cè)成立,這一年里,寒武紀(jì)科技面向產(chǎn)業(yè)界發(fā)布了商用深度學(xué)習(xí)處理器 IP 產(chǎn)品寒武紀(jì) 1A。為了讓芯片處理速度變得更快,寒武紀(jì)還專(zhuān)門(mén)為 1A 設(shè)計(jì)了專(zhuān)門(mén)的存儲(chǔ)結(jié)構(gòu),并設(shè)計(jì)了完全不同于通用 CPU 的指令集,在 1GHz 主頻下理論峰值性能為每秒 5120 億次半精度浮點(diǎn)運(yùn)算,對(duì)稀疏化神經(jīng)網(wǎng)絡(luò)的等效理論峰值高達(dá)每秒 2 萬(wàn)億次浮點(diǎn)運(yùn)算。在若干關(guān)鍵人工智能應(yīng)用上實(shí)測(cè),寒武紀(jì) 1A 達(dá)到了傳統(tǒng)的四核通用 CPU 25 倍以上的性能和 50 倍以上的能效。
2017 年,集成了寒武紀(jì)技術(shù)的華為 Kirin970 手機(jī)芯片和 Mate 10 手機(jī) 全球發(fā)布,實(shí)測(cè)結(jié)果表明寒武紀(jì)科技與華為的聯(lián)合研發(fā)成果在圖片識(shí)別速度上超越了搭載 A11 芯片的 iPhone X。
而去年底,寒武紀(jì)又公布了 3 款新一代 AI 處理器:面向低功耗場(chǎng)景視覺(jué)應(yīng)用的寒武紀(jì) 1H8(能效比為 1A 的 2.3 倍);擁有更廣泛通用性和更高性能的寒武紀(jì) 1H16 以及面向智能駕駛領(lǐng)域的寒武紀(jì) 1M。
另外,寒武紀(jì)還發(fā)布了面向云端的高性能智能處理器產(chǎn)品線:寒武紀(jì)高性能機(jī)器學(xué)習(xí)處理器芯片“寒武紀(jì) MLU100”和“寒武紀(jì) MLU200”,這兩款芯片分別偏重推理和訓(xùn)練兩個(gè)用途。
此外,寒武紀(jì)還表示其未來(lái)的芯片產(chǎn)品將全面支持多樣化的機(jī)器學(xué)習(xí)應(yīng)用,而不僅僅是常見(jiàn)的深度學(xué)習(xí)。
深鑒科技
深鑒科技成立于 2016 年,致力于成為國(guó)際先進(jìn)的深度學(xué)習(xí)加速方案提供者。該公司號(hào)稱具備世界頂尖的神經(jīng)網(wǎng)絡(luò)壓縮、編譯、體系結(jié)構(gòu)與指令集結(jié)構(gòu)設(shè)計(jì)、FPGA 開(kāi)發(fā)和系統(tǒng)集成的完整開(kāi)發(fā)能力。
目前,深鑒科技已經(jīng)自主研發(fā)了亞里士多德架構(gòu)的 DPU (Deep Learning Processor Unit) 。據(jù)了解,DPU 是面向深度學(xué)習(xí) (DL) 應(yīng)用的可編程通用計(jì)算平臺(tái),可以處理諸如圖像和視頻的分類(lèi) 、分割、檢測(cè) 、跟蹤 等任務(wù)。DPU 定義和實(shí)現(xiàn)了一套用于映射深度神經(jīng)網(wǎng)絡(luò) (DNN) 算法的高度優(yōu)化可編程指令集,在實(shí)現(xiàn)高性能、高能效比目標(biāo)的同時(shí)兼顧通用型和靈活性,不僅支持現(xiàn)有絕大部分流行的卷積神經(jīng)網(wǎng)絡(luò) (AlexNet、VGG,、GoogLeNet、ResNet,F(xiàn)aster-RCNN, SSD, YOLO 等),同時(shí)具備高度可擴(kuò)展性,在 DPU 指令集提供支持的基礎(chǔ)上可以無(wú)縫運(yùn)行其它用戶自行擴(kuò)展或衍生的神經(jīng)網(wǎng)絡(luò)。
目前,深鑒科技也已經(jīng)推出了多款人工智能加速模塊,2018 年還將推出首款 SoC 系列芯片——聽(tīng)濤 Tingtao。
西井科技
西井科技 成立于 2015 年 5 月,是一家開(kāi)發(fā)“類(lèi)腦神經(jīng)元芯片+算法”的科技公司,致力構(gòu)造一種完全跳脫于馮諾依曼結(jié)構(gòu)的神經(jīng)形態(tài)的芯片結(jié)構(gòu)——即模擬人腦神經(jīng)元工作原理而制造出的芯片,它既具備人腦的學(xué)習(xí)能力,又具備強(qiáng)大的特定運(yùn)算能力,僅需一塊郵票大小的芯片,就能模仿人類(lèi)大腦在短時(shí)間內(nèi)處理海量的感官信息。據(jù)稱該芯片具有低功耗,高效率,無(wú)需聯(lián)網(wǎng)等優(yōu)勢(shì)。
目前,西井科技已經(jīng)推出了兩款芯片:
可模擬 5000 萬(wàn)級(jí)別“神經(jīng)元”的仿生類(lèi)腦神經(jīng)元芯片——deepsouth(深南),功耗為傳統(tǒng)芯片在同一任務(wù)下的幾十分之一到幾百分之一。
擁有 12800 萬(wàn)個(gè)神經(jīng)元,通過(guò)專(zhuān)屬指令集調(diào)整芯片中神經(jīng)元資源分配的深度學(xué)習(xí)類(lèi)腦神經(jīng)元芯片——deepwell(深井)。
云天勵(lì)飛
云天勵(lì)飛創(chuàng)始人陳寧曾是中興通訊 IC 技術(shù)總監(jiān),帶領(lǐng)過(guò) 400 多人的芯片研發(fā)團(tuán)隊(duì)。此外,他還是國(guó)家 ” 千人計(jì)劃 ” 特聘專(zhuān)家,國(guó)僑辦 ” 重點(diǎn)華僑創(chuàng)業(yè)團(tuán)隊(duì) ” 帶頭人。2014 年 8 月,陳寧創(chuàng)立云天勵(lì)飛,主打智能視頻與圖像識(shí)別。
該公司一大特色便是其設(shè)計(jì)開(kāi)發(fā)了一款名叫 IPU (intelligent Processing Unit) 的芯片,專(zhuān)門(mén)面向深度學(xué)習(xí)的多層神經(jīng)網(wǎng)絡(luò)的計(jì)算并將它的運(yùn)算效率提升到 100 倍以上,通過(guò)重新定義一套指令值,使它運(yùn)行和計(jì)算深度神經(jīng)網(wǎng)絡(luò)可以更加高效。
有消息顯示,該芯片將于今年出貨。
Think Force
Think Force 成立于 2017 年,據(jù)介紹其團(tuán)隊(duì)核心成員主要來(lái)自 IBM,AMD,INTEL, ZTE 等業(yè)界龍頭芯片企業(yè),且都具備十年以上的專(zhuān)業(yè)芯片研發(fā)設(shè)計(jì)經(jīng)歷。該公司主要設(shè)計(jì)融合一流 AI 算法和先進(jìn)制成工藝的智能芯片,并以此構(gòu)建人工智能硬件平臺(tái),提供一站式行業(yè)應(yīng)用解決方案。
據(jù)稱,該芯片采用自主研發(fā)的微內(nèi)核 ManyCore 架構(gòu),能完成 AI 云虛擬化調(diào)度在芯片級(jí)的實(shí)現(xiàn),芯片虛擬化技術(shù)在需要彈性計(jì)算的場(chǎng)景中能夠成倍提高芯片使用率。另外,結(jié)合自主研發(fā)的固件和相關(guān) SDK 能夠?qū)崿F(xiàn)對(duì)于各類(lèi)神經(jīng)網(wǎng)絡(luò)模型的計(jì)算加速,加速單元實(shí)際效率在 90% – 95% 之間,相對(duì)于 Nvidia 的主流計(jì)算卡能達(dá)到 5 倍以上的功耗和成本節(jié)省。
比特大陸
近年來(lái)比特幣大火,而這也帶來(lái)了挖礦行業(yè)的繁榮,而 比特大陸 便是在這次挖礦行業(yè)爆發(fā)中迅速崛起的企業(yè),該公司憑借自己設(shè)計(jì)的比特幣挖礦專(zhuān)用 ASIC 芯片,一舉躍入 2017 年中國(guó) IC 設(shè)計(jì)公司前五的行列。據(jù)稱,目前全球 80% 甚至 90% 的礦機(jī)都由該公司提供。
而去年 11 月底比特大陸則發(fā)布了一款名叫 BM1680 的 TPU 張量加速計(jì)算芯片,正式進(jìn)軍 AI 芯片領(lǐng)域。據(jù)了解,該芯片可適用于 CNN、RNN 和 DNN 等多種神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)和訓(xùn)練,其加速核采用了改進(jìn)型 Systolic 架構(gòu)技術(shù),與 Google TPU 體系架構(gòu)類(lèi)似。
數(shù)據(jù)處理方面,該芯片浮點(diǎn)運(yùn)算能力峰值可達(dá) 2TFlops,而峰值功耗則為 41 瓦,平均功耗為 25 瓦。
啟英泰倫
成都 啟英泰倫 科技有限公司是一家專(zhuān)注于人工智能芯片設(shè)計(jì)及配套智能算法引擎開(kāi)發(fā)的公司,它于 2016 年 9 月推出了專(zhuān)用的基于 ASIC 架構(gòu)深度神經(jīng)網(wǎng)絡(luò)智能語(yǔ)音識(shí)別芯片 CI1006,并已實(shí)現(xiàn)了量產(chǎn)和出貨。
CI1006 是基于 ASIC 架構(gòu)的人工智能語(yǔ)音識(shí)別芯片,包含了腦神經(jīng)網(wǎng)絡(luò)處理硬件單元,能夠完美支持 DNN 運(yùn)算架構(gòu),進(jìn)行高性能的數(shù)據(jù)并行計(jì)算,可極大的提高人工智能深度學(xué)習(xí)語(yǔ)音技術(shù)對(duì)大量數(shù)據(jù)的處理效率。
據(jù)介紹,這是一款 專(zhuān)用于智能語(yǔ)音識(shí)別芯片方案,包含了腦神經(jīng)網(wǎng)絡(luò)處理硬件單元,能夠完美支持 DNN 運(yùn)算架構(gòu),性能相當(dāng)于數(shù)十個(gè) CPU 核的并行計(jì)算能力,成本不到通用芯片方案成本的 1/2,功耗則在 1/10 以下 。目前,基于該芯片的單/雙麥克風(fēng)方案均可以實(shí)現(xiàn)十米識(shí)別距離,識(shí)別精度在 90% 以上。
耐能科技
耐能 (Kneron) 于 2015 年由臺(tái)灣人創(chuàng)立于美國(guó)圣地牙哥,創(chuàng)始人劉峻誠(chéng)表示,公司的核心競(jìng)爭(zhēng)力在于主打輕量級(jí)的 NPU,能耗比可以做到 100mW 到 300mW,最新的一款產(chǎn)品甚至可以到 10mW 以下。
而且其芯片尺寸也比較小,比如耐能(Kneron)于 2016 年推出終端裝置專(zhuān)用的人工智慧芯片——神經(jīng)網(wǎng)路處理器(Neural Processing Unit,NPU),相較于主流的神經(jīng)網(wǎng)絡(luò)芯片,體積可以縮小至 1/40。
深思考科技
深思考 是一家專(zhuān)注于類(lèi)腦人工智能與深度學(xué)習(xí)核心科技的高科技公司。核心團(tuán)隊(duì)由來(lái)自于中科院自動(dòng)化所、軟件所、計(jì)算所、微電子所等中科院院所人工智能、機(jī)器學(xué)習(xí)方向的資深科學(xué)家組成。
公司目前已經(jīng)推出了 ARGUS DPU 深度學(xué)習(xí)處理器,可為專(zhuān)用領(lǐng)域(如智能視頻處理、安防監(jiān)控、ADAS、醫(yī)療圖像處理等)的人工智能與深度學(xué)習(xí)計(jì)算提供高性能硬件加速,賦予智能終端高性能、高可靠、實(shí)時(shí)的深度學(xué)習(xí)計(jì)算能力。除各類(lèi)深度學(xué)習(xí)算法外,也支持各類(lèi)傳統(tǒng)算法框架(如 OpenCV),并提供豐富的接口滿足客戶產(chǎn)品的應(yīng)用需求。ARGUS DPU 支持處理模組級(jí)聯(lián),以成倍提高實(shí)時(shí)算力。不過(guò),目前該公司并沒(méi)有透露具體的性能參數(shù)。
異構(gòu)智能
異構(gòu)智能 是由著名人工智能專(zhuān)家、計(jì)算機(jī)博弈專(zhuān)家、異構(gòu)智能專(zhuān)家吳韌博士掛帥,帶領(lǐng)一批人工智能、深度學(xué)習(xí)和異構(gòu)計(jì)算領(lǐng)域頂尖的技術(shù)人才組成團(tuán)隊(duì),于 2015 年 8 月在硅谷創(chuàng)立的公司,專(zhuān)注于提供“ASIC 芯片+訓(xùn)練模型”的全棧式 AI 解決方案。
今年 CES 期間,該公司發(fā)布了其第一款高性能、低功耗的 AI 芯片 NovuTensor。
異構(gòu)智能方面表示這是截至目前世界上唯一一款能夠?qū)嶋H運(yùn)行的、性能達(dá)到主流 GPU/TPU 水平而性能/功耗比卻遠(yuǎn)超主流 GPU/TPU 的芯片——在功耗 12w 的情況下,NovuTensor 每秒可識(shí)別 300 張圖像,每張圖像上,最多可檢測(cè) 8192 個(gè)目標(biāo),相比目前最先進(jìn)的桌面服務(wù)器 GPU(250W,每秒可識(shí)別 666 張圖像),僅使用 1/20 電力即可達(dá)到其性能的 1/2;而相比目前最先進(jìn)的移動(dòng)端或嵌入式芯片,相同用電的情況下,性能是其三倍以上。
寫(xiě)在最后
需要提及的是,號(hào)稱“世界首款手機(jī) AI 芯片”的華為麒麟 970 并未收錄到本文中,因?yàn)轺梓?970 使用的是寒武紀(jì)的神經(jīng)網(wǎng)絡(luò)處理單元(NPU),在物體識(shí)別方面的一整套嵌入式 AI 解決方案則來(lái)自 中科創(chuàng)達(dá) 。
無(wú)論如何,AI 芯片領(lǐng)域發(fā)展得相當(dāng)快,未來(lái)也勢(shì)必將有更多的 AI 芯片企業(yè)入局。中國(guó)的這些企業(yè)能否破除中國(guó)芯片高度依賴進(jìn)口的魔咒呢?我們拭目以待。
文章編輯:CobiNet(寧波)
本公司專(zhuān)注于電訊配件,銅纜綜合布線系列領(lǐng)域產(chǎn)品研發(fā)生產(chǎn)超五類(lèi),六類(lèi),七類(lèi)線,屏蔽模塊,配線架及相關(guān)模塊配件的研發(fā)和生產(chǎn)。
?2016-2019寧波科博通信技術(shù)有限公司版權(quán)所有浙ICP備16026074號(hào)