語音識(shí)別芯片現(xiàn)在已經(jīng)成為了市場(chǎng)上的主流方案了,幾乎高級(jí)一點(diǎn)的產(chǎn)品都要帶上語音識(shí)別芯片,主要原因就是語音識(shí)別芯片可以做到識(shí)別人說話并轉(zhuǎn)化成指定去控制對(duì)應(yīng)的功能。下面小編就帶大家一起去了解語音識(shí)別芯片的前世今生。1952 年,埃德瓦爾德(Everett)和科爾特(Kleitman)發(fā)表了《計(jì)算機(jī)識(shí)別人類語音》的論文,開啟了語音識(shí)別技術(shù)的研究大門。當(dāng)時(shí)的語音識(shí)別主要集中在小詞匯量、孤立詞、特定人語音識(shí)別方法上,采用簡(jiǎn)單的模板匹配方法,如動(dòng)態(tài)時(shí)間規(guī)整(DTW)、支持向量機(jī)(SVM)、矢量量化(VQ)等主流算法。這個(gè)時(shí)期的技術(shù)局限性較大,例如對(duì)同一個(gè)人,在其感冒等情況下聲音發(fā)生變化就可能無法識(shí)別,而且命令詞較多時(shí)識(shí)別效率很低。概率統(tǒng)計(jì)型方法興起(1993 年 - 2009 年):主流技術(shù)是高斯混合模型 - 隱馬爾可夫模型(GMM - HMM)。HMM 模型在將語音轉(zhuǎn)換為文本的過程中,增加了音素和狀態(tài)兩個(gè)轉(zhuǎn)換單位,GMM 則將狀態(tài)的特征分布用概率模型來表述,提升了語音幀到狀態(tài)的準(zhǔn)確率。基于 GMM - HMM 框架,后續(xù)又提出了許多改進(jìn)方法,如動(dòng)態(tài)貝葉斯方法、區(qū)分性訓(xùn)練方法、自適應(yīng)訓(xùn)練方法、HMM/NN 混合模型方法等。然而,GMM + HMM 模型在大詞匯量的語音識(shí)別情況下,識(shí)別準(zhǔn)確率和效率均比較差。語音識(shí)別芯片開始出現(xiàn):早期的語音識(shí)別芯片配置等同于通用的低端 MCU,以臺(tái)灣新塘為代表的廠商...
發(fā)布時(shí)間:
2025
-
06
-
17
瀏覽次數(shù):80
語音識(shí)別芯片本身并不能實(shí)現(xiàn)智能對(duì)話,但是語音識(shí)別芯片可以智能對(duì)話,主要原因是語音識(shí)別芯片的主要功能是接受音源同時(shí)對(duì)音源進(jìn)行轉(zhuǎn)換,進(jìn)行降噪濾波和解碼等處理以后把聲音處理成機(jī)器可以理解的信息或者文字。 語音芯片怎么樣才能實(shí)現(xiàn)智能對(duì)話? 智能對(duì)話是一個(gè)比較模糊的概念,如果想要全模態(tài)的智能對(duì)話光靠一枚本地化處理的語音芯片肯定是是不行,這時(shí)候就可以通過網(wǎng)絡(luò)連接大模型,通過語音識(shí)別芯片把聲音處理成文本,然后等待大模型返回文本信息,最后通過文字轉(zhuǎn)化聲音輸出。 語音識(shí)別芯片實(shí)現(xiàn)智能對(duì)話的工作流程 麥克風(fēng) → 語音識(shí)別芯片 → NLP云端服務(wù) → 對(duì)話系統(tǒng) → TTS → 揚(yáng)聲器 當(dāng)然還有一些高端化的語音芯片也可以實(shí)現(xiàn)本地計(jì)算,在芯片上集成輕量化的NLP模型,實(shí)現(xiàn)一些簡(jiǎn)單的本地對(duì)話,比如WTK6900系列就可以支持本地和本地+聯(lián)網(wǎng)的模式。 語音識(shí)別芯片的多種類型 語音識(shí)別芯片其實(shí)也分各種類型的,有工業(yè)級(jí)的有車規(guī)級(jí)的還有軍工級(jí)的,以工業(yè)級(jí)的語音識(shí)別芯片為例,工業(yè)級(jí)的語音芯片可以支持-45℃-85℃的寬溫域,一般來說工業(yè)級(jí)已經(jīng)可以滿足所有家電的日常需求了。 語音識(shí)別芯片因?yàn)槭袌?chǎng)化的需求也會(huì)分很多不同的系列來適配市場(chǎng)的需求,比如遠(yuǎn)場(chǎng)識(shí)別有1米的也有10米的,語音識(shí)別率有97%的也有90%的,本地化語音指令的數(shù)量,還有新能的核心頻率以及拓展接口的需求等等。 語音識(shí)別芯片常用的型號(hào) WT2...
發(fā)布時(shí)間:
2025
-
06
-
16
瀏覽次數(shù):81
語音芯片其實(shí)出現(xiàn)已經(jīng)很多年了,而語音識(shí)別芯片是近些年從語音芯片的基礎(chǔ)上迭代而來!早起的語音芯片主要負(fù)責(zé)語音播放的基礎(chǔ)功能,隨著時(shí)代的變化,語音播放的要求越來越好,從簡(jiǎn)單的語音播放到高品質(zhì)的語音播放,由此語音芯片的采樣率也從早起的8K到現(xiàn)在的44K。而語音識(shí)別芯片和語音芯片最大的區(qū)別就在于識(shí)別,語音識(shí)別芯片可以收集用戶的聲音,然后通過NLP等技術(shù)來識(shí)別用戶的指令,并且執(zhí)行或者反饋用戶的指令。 當(dāng)下的AI智能玩具基本上都是搭載語音識(shí)別芯片來實(shí)現(xiàn)的不僅僅是AI玩具還有很多產(chǎn)品都在慢慢的迭代智能對(duì)話智能控制的功能。 1.智能家居 通過語音控制電視機(jī)、洗衣機(jī)、空調(diào)、電冰箱、燈光、掃地機(jī)、電飯煲、音箱等等。不需要?jiǎng)邮志褪呛醚剑h(yuǎn)遠(yuǎn)的喊一句,就可以達(dá)到控制家電的目的。 2.車載控制 當(dāng)下系能源汽車語音控制已經(jīng)是標(biāo)配了,都可以實(shí)現(xiàn)語音控制能,只不過控制效果各異,使用的芯片也不同,有些是集成在車機(jī)的soc里面,有些是單獨(dú)的語音識(shí)別芯片,基于車機(jī)廠家的方案預(yù)算不同效果會(huì)有差別。 3.醫(yī)療監(jiān)控應(yīng)用 目前在醫(yī)院其實(shí)也能看到一些這類型的設(shè)備,比較多的就是語音提示功能,比如量血壓的血壓計(jì),在量完以后會(huì)報(bào)出相關(guān)參數(shù)。升級(jí)成語音識(shí)別芯片的話,可以做到聯(lián)網(wǎng)查詢分析結(jié)果以后通過語音反饋給用戶。 4.消費(fèi)電子產(chǎn) 玩具類的會(huì)比較多,比如小朋友的語音機(jī)器人,通過語音對(duì)話機(jī)器人給小朋友唱歌念書讀英語等功能,...
發(fā)布時(shí)間:
2025
-
06
-
13
瀏覽次數(shù):84