0
| 本文作者: 木子 | 2018-01-30 10:06 |
自2017年以來,人工智能(AI)的發展熱潮已經蔓延到集成電路領域,不僅如英偉達、海思、英特爾等大廠但凡有個風吹草動就能霸占頭條,諸多新晉公司也相繼重磅發布了有關人工智能芯片的產品。如果說當今科技界什么最火,AI芯片毫無疑問是最大熱門之一。
泓觀科技(otureo.ai),由三位清華校友創立于2015年的科技型公司,一直致力于通過邊緣計算實現深度學習高效率賦能于嵌入端設備和應用,與上下游合作伙伴攜手共筑人工智能產業生態。一貫低調潛行的他們,也在用著自己的方式開拓著另一條產品線,如今破繭而出——面向物聯網(IoT)物聯端率先推出超低功耗異步AI芯片,上演了一次另辟蹊徑的厚積薄發。

泓觀科技選擇了一個AI芯片領域中獨特的發力點潛心磨礪,提出并設計了一種全新的基于異步架構的卷積神經網絡AI芯片,劍指loT物聯端的超低功耗智能化場景應用需求,可以極大的降低loT場景下智能數據分析所需的功耗。目前,首款該類芯片已經由泓觀科技的團隊率先設計完成并實現流片(如下圖),這是迄今面向IoT領域的異步架構AI芯片的第一次問世。

泓觀科技的創始人向雷鋒網介紹到:“從近20年前我們進入清華大學微電子學專業讀書時算起,雖然后面的職業生涯不斷帶來更多元化的知識背景,但畢竟都算是集成電路這一行里多年的從業者了,對于芯片這個龐大產業的自身規律有著自己的理解和認知。既然決定在AI芯片這里也做點兒事情,構建第二產品線,我們希望選擇一個獨特而有趣的著力點,對應具有一定差異化的應用領域和生態位置,同時可以與我們依托平臺型系統芯片的第一產品線,兼容互補,相得益彰。”
泓觀科技所采用的異步架構,與這個領域中先前已推出的各類AI芯片有著顯著的區別。先前的AI芯片有一個共同的特點,就是遵循功能與性能優先的設計原則。其針對的應用場景主要分為兩類:基于云端的在線計算和基于前端設備的離線計算。前者如Google TPU系列、比特大陸Sophon系列等;后者如Movidius Myriad系列、海思包含NPU的Kirin970、Apple包含Neural Engine的A11等,即使作為前端AI芯片,其應用環境也集中在手機、無人機等高端設備上。
然而對于IoT設備及其應用場景而言,上述AI芯片的架構與特點并不適合。“一則因為loT 設備通常專注于某種單一功能,例如針對視頻采集的設備一般情況下無需運行語音識別和自然語言處理的相關算法;二則相較于手機、無人機這樣的高端設備,大部分loT設備的剛性需求在于超低功耗,性能并非第一考慮因素。”泓觀科技的創始人這樣告訴雷鋒網,“像我們這樣,遵循著完全不同的設計原則和技術路線來實現卷積神經網絡AI芯片,可以說有點卓爾不群甚至頗為超前。就目前已知的媒體報道,我們應該是率先實現異步卷積神經網絡電路方案并實現流片的創業公司,不論在中國還是世界范圍內。”
關于這款具有首創意義的超低功耗異步卷積神經網絡AI芯片,泓觀科技的創始人向雷鋒網予以了頗為詳盡的講解。
“首先要從架構設計上入手。IoT 設備大多無需集成通用型芯片,只需根據應用需求設計定制架構即可。”泓觀科技在芯片架構上專注于卷積模型所支持的特定操作(如卷積、池化等),并針對識別場景的特點,考慮芯片工藝、面積、片上存儲等因素,對支持的網絡架構加入一定的約束(如層數、通道數量等)。

“大量的loT設備只有在被喚醒時才工作,設備經常處在休眠狀態,如何在設備休眠狀態下嚴格控制功耗產生,是重中之重。”在這個環節,泓觀科技采用了異步(asynchronous)電路技術,與常規的同步(synchronous)電路對比(如上圖),異步電路能夠保證芯片在設備休眠時,產生的功耗可以忽略不計。

“接下來優化訪存同樣是一個關鍵環節。”受限于芯片面積和成本,片上存儲的容量也非常有限,傳統解決辦法是引入大量的片外I/O 訪存,但由于 IoT 設備的自身特點,偏低的片外訪存效率會導致性能下降和功耗增加。泓觀科技則采用了多層融合的架構技術(如上圖)來減少 I/O 訪存——通過架構和算法的交互優化(co-design),保證算法層的輸出數據能夠被有效緩存。

此外,神經網絡操作對數據存在較強的魯棒性,因而網絡對于數據的精度變化并不敏感。泓觀科技通過定點化處理神經網絡,使用16位數據甚至更低的比特數可以保持網絡性能基本不下降,并通過自動化搜索不同網絡層定點化配置的方法,對權值和輸入/輸出采用不同的策略(如上圖)。

同時,泓觀團隊設計了一種自動化剪枝算法(如上圖),對神經網絡的每一層建立單獨的剪枝參數,從而解決了神經網絡本身存在的冗余性。

基于上述設計要點的異步卷積神經網絡芯片,其整體框架圖如上。泓觀科技的創始人告訴雷鋒網,“在同樣的芯片制程、達到相同性能的情況下,位于芯片active ratio(工作時間占比)較低的應用區間,相比基于傳統同步電路,采用異步電路設計可以顯著減少功耗,而這一區間恰恰是大量的物聯網終端智能化應用場景的分布重心。”下圖顯示了不同active ratio條件下,同步電路和異步電路的功耗對比。可以看到,在物聯端應用重點分布的低active ratio區間,采用異步架構的AI芯片,可以將功耗降低近一個量級甚至更多。

這款獨特而全新的異步卷積神經網絡芯片,其功能聚焦于物體識別等智能化視覺分析,面向可穿戴設備、智能家居、自供能(如太陽能)監控等對超低功耗有剛性需求的IoT終端領域,逐步賦能實現AI應用落地。“這個路線及發力點的選擇,來源于我們對技術發展和市場定位的思考與判斷。” 泓觀科技的創始人這樣總結到,“屆時從不久的未來里回望,這款芯片所代表的特質,應當不再是獨特和另類。對于AI和IoT這兩大領域的廣泛交匯和深度融合,相信這一次意味著一個開端。”
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。