淺談語音AI芯片的特點與發展階段

您所在的位置：首頁 > 公司動態頻道 > 淺談語音AI芯片的特點與發展階段詳情頁

News center
行業資訊

淺談語音AI芯片的特點與發展階段

編輯：創唯芯電子頻道：公司動態發布時間：2023-04-18 網站：www.cslms.org

AI語音芯片蓄勢待發，智能語音市場將迎來財富風波

隨著智能音箱的火熱以及背后語音交互生態的成熟，將會帶動越來越多的設備語音化、智能化，使語音真正成為人機交互的一個界面。而在語音交互設備中，語音芯片憑借定制化、低功耗、高能效、端智能以及成本優勢等地位越發重要，成為人與云端“溝通”的橋梁。

在智能語音市場，隨著亞馬遜、谷歌等互聯網巨頭公司的推動，僅僅是智能音箱一個品類今年的全球銷量預期有望達到3000萬臺，并陸續涌現在各個國家，市場呈爆發之態。作為語音芯片市場最大的玩家聯發科以占據了70%的市場份額，2017年語音芯片出貨量預計達到2000萬片以上。

目前，智能音箱的迅速發展正成為語音芯片崛起的重要動力。通過對目前市面上語音芯片的觀察，我們發現語音芯片有以下特點：

語音芯片的特點

1、兼具運算能力和低功耗的考量，采用最適合做語音處理的CPU（中央處理器）；

2、是具備高度整合性的語音SoC，支持多通道的麥克風陣列接口，集成Codec（多媒體數字信號編解碼器）模塊/DSP（數字信號處理）模塊，并且集成WiFi/藍牙模塊等；

3、在語音算法上支持回聲消除、噪聲抑制、聲源定位、語音增強等技術，或具備良好的音值調節功能；

4、端智能化，集成神經網絡單元將部分云端訓練好的智能本地化工作。

語音芯片的發展階段

根據語音交互的發展狀況，將語音芯片的發展歸納為三個階段:

第一個階段為語音芯片過渡期，采用通用芯片組合方案。大約2015年以前，語音設備采用的多是通用芯片+Codec芯片/DSP芯片等相結合的方式實現語音處理，如全志的R16芯片。

第二個階段為崛起期，語音芯片興起。2015年-2017年之間，隨著智能語音設備市場規模進一步發展，專門用于智能家居或智能音箱的語音芯片開始陸續亮相，如聯發科推出的MT8516芯片、科勝訊的CX20924/CX20921、Amlogic的A113、瑞芯微的RK3036/RK3229等。

第三個階段為語音芯片進化期，語音AI芯片涌現。隨著智能語音設備的迅速發展，對于端智能的需求也在顯現，語音AI芯片應運而生。端智能是近兩年來AI領域大火的概念之一，指的是數據的采集、計算、決策都在前端設備進行，優勢在于穩定、時延小、同時能夠保護用戶隱私等。

語音AI芯片的特點

AI芯片也被稱為AI加速器或計算卡，即專門用于處理人工智能應用中的大量計算任務的模塊（其他非計算任務仍由CPU負責），從而實現端側智能。對比語音芯片，語音AI芯片具備以下特點：1、語音AI芯片中集成了專用的AI處理器模塊，用以對本地的機器學習算法進行加速；2、高度集成，語音AI芯片不但集成CPU、AI處理器，還會將DSP信號處理、WiFi/藍牙等模塊集成進去；3、能夠實現端側智能，將一些常用或者簡單的功能直接集成到本地，通過AI芯片進行本地計算，從而設備可以在端側離線完成如聽音樂、日常問答及閑聊等任務，實現更快的交互能力。

語音芯片的領域應用

目前的AI芯片更多的在于手機和視覺應用領域，一方面手機市場體量足夠龐大，另一方面視覺應用技術也相對成熟。而在語音領域，一方面語義理解技術短期內很難突破，另外智能語音是一個新興市場。目前在語音芯片行業已涌現出數十家公司在這一領域“開疆擴土”，既有芯片領域的大公司，面向智能家居、消費電子領域的國有芯片品牌，還有新興的創業公司。隨著智能語音的興起，芯片也經歷著從通用組合芯片到語音芯片再到語音AI芯片的演進，可以預見的是，未來的1~2年可能將會是語音芯片爆發的高峰期。