1、支持wifi、BLE、4G、UART串口通信傳輸。
2、流媒體上傳下載播放。
3、具備離在線語音喚醒識別。
4、51國語種22種國內方言切換。
5、靈活創建識別詞條。
6、自定義個性回復音:TTS、錄音、音頻。
? ? ? ? WT2605C在線語音識別方案是基于離線語音識別芯片為基礎,集成了在線語音識別引擎、詞條規則引擎、NLP自然語言處理引擎、在線TTS引擎、流媒體上傳下載播放等技術,通過連接網絡實現了對全球主流語言識別的支持,可廣泛應用于智能家居、AI對話、提示播報類產品;
? ? ? ??產品具有低成本、低功耗、高可靠性、通用性強等特點,QFN32封裝,4*4mm體積??;用內置BLE或外部集成WIFI、4G通信組件,賦予千行百業產品語音交互能力,讓您的產品輕松對接AI大模型;我們相信通過我們的技術及開放服務可以助您產品成功一臂之力。
(離在線語音識別方案演示)
?
? ? ? ??我們可提供套片與模組方案,支持wifi、BLE、4G、UART串口通信傳輸,提供模塊/套片產品服務,開放API及硬件通信協議便于快速集成。
??芯片的工作電壓范圍2.6V-5.0V;
? WT2605CX芯片為雙模藍牙,即音頻藍牙和數傳藍牙,雙模藍牙功能符合藍牙5.0和BLE規范;
? 藍牙上電后,音頻藍牙默認不開啟,僅開啟BLE藍牙,BLE藍牙名稱為:BLE_WT2605C;
? 藍牙晶振參數:24MHZ _9PF,±10PPM,具體型號參考可與本司業務溝通;
? 藍牙連接距離盡量保持在10M以內,藍牙芯片布局請參考本司相關文檔說明;
? 采用WT2605CX芯片芯片為核心,最大可支持外掛128Mbit SPI-Flash;SPI-Flash存放為固定音源區(可更新);
? USB接口作用:支持U盤升級語音IC固件;支持USB連接到電腦拷貝音頻文件到外置Flash中;U盤最大支持32G;
? 標準UART通信接口,可以靈活實現指定地址播放、指定文件名播放、音量級數、播放停止;
? 支持FAT、FAT32文件系統,支持MP3格式;
? 典型TX輸出功率+2db;
? 音頻編解碼器支持16位立體聲DAC和兩個通道16位ADC;
? 高性能立體聲,ADC具有90dB的信噪比;
??重點注意:語音芯片如果需要掛flash。建議使用“唯創”出的flash,其他廠商的flash,不能保證可以正常工作。(建議將150mil和208mil尺寸兼容擴展畫上,更方便備貨);
??支持U盤升級模塊固件程序,建議畫板時預留出USB接口;
?
1. 離在線識別方案
離在線識別芯片方案,支持離線喚醒,詞條可在線修改、自動下發,無需在本地訓練。支持51國語種22種國內方言切換,靈活創建識別詞條,自定義個性回復音:可通過APP內進行TTS、錄音、上傳本地音頻,創建專屬化詞條。同時支持離線UART串口對接協議,用于開發者MCU對接,控制本地自有設備,如燈控、屏顯、電機等。
?
2. 藍牙更新方案
藍牙更新方案,通過BLE傳輸MP3 音頻數據,支持APP內進行TTS文本合成、錄音、上傳本地音頻到語音芯片外置存儲中(最大可掛載128Mbit Flash)。MCU發送UART指令控制語音芯片播放、停止、音量大小調節等。同時支持數據透傳功能,使能芯片IO口,進入或退出BLE透傳。
?
3. AI對話方案
AI對話:按鍵/手機APP拾音,流媒體上傳、流媒體播放下載,支持按鍵打斷、音量調節,開放API接口,具備集成大模型能力。目前AI對話支持以下技能:支持角色創建、對話、天氣、故事、新聞、自定義企業知識庫等。
?
?
?
?
?