AI語音芯片蓄勢待發,智能語音市場將迎來財富風波
隨著智能音箱的火熱以及背后語音交互生態的成熟,將會帶動越來越多的設備語音化、智能化,使語音真正成為人機交互的一個界面。而在語音交互設備中,語音芯片憑借定制化、低功耗、高能效、端智能以及成本優勢等地位越發重要,成為人與云端“溝通”的橋梁。
在智能語音市場,隨著亞馬遜、谷歌等互聯網巨頭公司的推動,僅僅是智能音箱一個品類今年的全球銷量預期有望達到3000萬臺,并陸續涌現在各個國家,市場呈爆發之態。作為語音芯片市場最大的玩家聯發科以占據了70%的市場份額,2017年語音芯片出貨量預計達到2000萬片以上。
目前,智能音箱的迅速發展正成為語音芯片崛起的重要動力。通過對目前市面上語音芯片的觀察,我們發現語音芯片有以下特點:
1、兼具運算能力和低功耗的考量,采用最適合做語音處理的CPU(中央處理器);
2、是具備高度整合性的語音SoC,支持多通道的麥克風陣列接口,集成Codec(多媒體數字信號編解碼器)模塊/DSP(數字信號處理)模塊,并且集成WiFi/藍牙模塊等;
3、在語音算法上支持回聲消除、噪聲抑制、聲源定位、語音增強等技術,或具備良好的音值調節功能;
4、端智能化,集成神經網絡單元將部分云端訓練好的智能本地化工作。
根據語音交互的發展狀況,將語音芯片的發展歸納為三個階段:
第一個階段為語音芯片過渡期,采用通用芯片組合方案。大約2015年以前,語音設備采用的多是通用芯片+Codec芯片/DSP芯片等相結合的方式實現語音處理,如全志的R16芯片。
第二個階段為崛起期,語音芯片興起。2015年-2017年之間,隨著智能語音設備市場規模進一步發展,專門用于智能家居或智能音箱的語音芯片開始陸續亮相,如聯發科推出的MT8516芯片、科勝訊的CX20924/CX20921、Amlogic的A113、瑞芯微的RK3036/RK3229等。
第三個階段為語音芯片進化期,語音AI芯片涌現。隨著智能語音設備的迅速發展,對于端智能的需求也在顯現,語音AI芯片應運而生。端智能是近兩年來AI領域大火的概念之一,指的是數據的采集、計算、決策都在前端設備進行,優勢在于穩定、時延小、同時能夠保護用戶隱私等。
AI芯片也被稱為AI加速器或計算卡,即專門用于處理人工智能應用中的大量計算任務的模塊(其他非計算任務仍由CPU負責),從而實現端側智能。 對比語音芯片,語音AI芯片具備以下特點:1、語音AI芯片中集成了專用的AI處理器模塊,用以對本地的機器學習算法進行加速;2、高度集成,語音AI芯片不但集成CPU、AI處理器,還會將DSP信號處理、WiFi/藍牙等模塊集成進去;3、能夠實現端側智能,將一些常用或者簡單的功能直接集成到本地,通過AI芯片進行本地計算,從而設備可以在端側離線完成如聽音樂、日常問答及閑聊等任務,實現更快的交互能力。
目前的AI芯片更多的在于手機和視覺應用領域,一方面手機市場體量足夠龐大,另一方面視覺應用技術也相對成熟。而在語音領域,一方面語義理解技術短期內很難突破,另外智能語音是一個新興市場。目前在語音芯片行業已涌現出數十家公司在這一領域“開疆擴土”,既有芯片領域的大公司,面向智能家居、消費電子領域的國有芯片品牌,還有新興的創業公司。隨著智能語音的興起,芯片也經歷著從通用組合芯片到語音芯片再到語音AI芯片的演進,可以預見的是,未來的1~2年可能將會是語音芯片爆發的高峰期。