智能生活就上智和家

本地優(yōu)質(zhì)智能家居服務(wù)商為您服務(wù)

10秒估算智裝報(bào)價(jià)

  • m2

智能家居語音控制解決方案

2020-12-31 09:38:36 共閱4262次

在智能家居給人們帶來便捷生活的同時(shí),人們的控制習(xí)慣逐漸發(fā)生改變。語音技術(shù)的發(fā)展也為控制入口做了一個(gè)補(bǔ)充,在拋去了傳統(tǒng)遙控器和手機(jī)APP之后,通過口令發(fā)送讓家居環(huán)境達(dá)到舒適狀態(tài),讓生活更便捷智能,這是否會(huì)成為智能家居行業(yè)下一個(gè)階段的普遍應(yīng)用?今天小編在這里就為大家講解一下目前語音控制技術(shù)存在的問題,以及成熟的語音控制技術(shù)應(yīng)用的解決方案。

智能家居語音控制技術(shù)

與機(jī)器進(jìn)行語音交流,讓機(jī)器明白你說什么,這是人們長期以來夢寐以求的事情。語音識(shí)別技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。

語音識(shí)別是一門交叉學(xué)科,語音識(shí)別技術(shù)與語音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤,通過語音命令進(jìn)行操作,語音技術(shù)的應(yīng)用已經(jīng)成為一個(gè)具有競爭性的新興高技術(shù)產(chǎn)業(yè)。

目前語音控制技術(shù)存在的問題

目前,對(duì)于語音控制類的智能硬件產(chǎn)品在很多場景下因語音交互體驗(yàn)不如人意而深受詬病,究其原因主要是受限于空間距離、背景噪音、其他人聲干擾、回聲、混響等多重復(fù)雜因素,進(jìn)而導(dǎo)致的識(shí)別距離近、識(shí)別率低等明顯痛點(diǎn)。

除此之外,單是中國語系、方言和口音就相當(dāng)多,加上中文的多語義性,所以不同地區(qū)的人使用語音控制識(shí)別率差異較大。同時(shí),在語義識(shí)別上,也存在上下文的關(guān)聯(lián)帶來識(shí)別的學(xué)習(xí)難、定位難和建立模型難等問題。

智能家居語音控制解決方案

科大訊飛作為中國最大的智能語音技術(shù)提供商,在智能語音技術(shù)領(lǐng)域有著長期的研究積累,并在中文語音合成、語音識(shí)別、口語評(píng)測等多項(xiàng)技術(shù)上擁有國際領(lǐng)先的成果。對(duì)于智能家居語音控制的應(yīng)用,必須解決好距離、效率、個(gè)性化、方言、喚醒等問題,科大訊飛在這些方面都有非常成熟的解決方案。

距離:遠(yuǎn)場識(shí)別技術(shù)打破距離瓶頸

近場識(shí)別技術(shù)目前已經(jīng)比較成熟,現(xiàn)在手機(jī)上使用的語音輸入功能就屬于近場識(shí)別技術(shù),用戶必須在離手機(jī)比較近的距離內(nèi)說話,但在智能家居環(huán)境中,用戶和智能終端之間的距離被大大增加了,用戶能隨意用語音控制智能家居的一個(gè)必要條件就是在無論你在客廳哪個(gè)角落發(fā)出指令,設(shè)備都能準(zhǔn)確的識(shí)別,語音識(shí)別技術(shù)必須突破距離的障礙。

目前室內(nèi)的語音交互受到背景噪音、其他人聲干擾、回聲、混響等多重復(fù)雜因素影響,導(dǎo)致識(shí)別率低甚至無法使用,只能在相對(duì)安靜、近距離的環(huán)境下使用。而遠(yuǎn)場識(shí)別技術(shù)將能夠很好的解決這些問題。

科大訊飛于2015年3月發(fā)布遠(yuǎn)場識(shí)別技術(shù),是目前唯一支持超過5米的語音識(shí)別技術(shù),突破了語音交互距離瓶頸,大幅度改進(jìn)了語音交互的自由度。該技術(shù)利用麥克風(fēng)陣列的空域?yàn)V波特性——在目標(biāo)說話人方向形成拾音波束(BeamForming),抑制波束之外的噪聲,結(jié)合獨(dú)特的去混響算法,最大程度的吸收反射聲,從而達(dá)到去除混響的目的,用戶在客廳的任意角落通過語音操控智能家電已成為現(xiàn)實(shí)。

效率:快速反應(yīng)實(shí)現(xiàn)秒懂

近年來,隨著深度學(xué)習(xí)理論的爆發(fā)式發(fā)展及其在語音識(shí)別領(lǐng)域獲得的顯著效果,同時(shí)Kaldi等開源語音識(shí)別工具也在工業(yè)界和學(xué)術(shù)界逐漸普及,語音識(shí)別的門檻持續(xù)降低,許多公司都具備了語音識(shí)別的能力及相關(guān)產(chǎn)品,但是一些產(chǎn)品反應(yīng)慢,說出一句話往往要等待很久才能顯示結(jié)果,另外,準(zhǔn)確率也不高,存在識(shí)別不出來的情況。

針對(duì)語音識(shí)別準(zhǔn)確率和響應(yīng)速度的問題,科大訊飛持續(xù)在核心技術(shù)和產(chǎn)品特性上做出創(chuàng)新,在把國際領(lǐng)先的深度神經(jīng)網(wǎng)絡(luò)技術(shù)引入語音識(shí)別的基礎(chǔ)上,基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)算法對(duì)輸入語音進(jìn)行“識(shí)別關(guān)鍵信息無損”的降噪,通過海量訓(xùn)練語料基礎(chǔ)上的高精度聲學(xué)模型和語言模型訓(xùn)練,并結(jié)合極致的解碼引擎工程技術(shù),實(shí)現(xiàn)了在很小延遲的情況下,做到將去除原始語音的噪聲干擾和識(shí)別幾乎同時(shí),大大提高了語音輸入的響應(yīng)速度和用戶體驗(yàn),在大詞匯連續(xù)語音識(shí)別率上可以達(dá)到95%以上,命令詞識(shí)別率達(dá)到99%以上,解碼引擎可以在用戶說完話40毫秒之內(nèi)給出結(jié)果,真正實(shí)現(xiàn)“秒懂”。

個(gè)性化:自動(dòng)學(xué)習(xí)適應(yīng)用戶使用習(xí)慣

每個(gè)人在說話時(shí),口音、語速、口頭禪都不一樣,那么家里的智能設(shè)備只會(huì)識(shí)別一些基本詞句顯然是遠(yuǎn)遠(yuǎn)不夠的,它們必須要更懂你。比如,懂你的口音、方言、口頭禪以及時(shí)不時(shí)蹦出的專業(yè)詞匯等。

讓智能設(shè)備適應(yīng)每個(gè)人的使用習(xí)慣可能嗎?答案是肯定的。這里要用的到就是語音識(shí)別的另外一項(xiàng)關(guān)鍵技術(shù)——個(gè)性化識(shí)別技術(shù)。個(gè)性化識(shí)別指的是語音識(shí)別系統(tǒng)具備自動(dòng)學(xué)習(xí)并適應(yīng)用戶使用習(xí)慣的能力,你用的越多,它越懂你。一般來說,個(gè)性化識(shí)別包括發(fā)音和語言兩方面。其中發(fā)音個(gè)性化主要是指系統(tǒng)對(duì)用戶語速、口音等發(fā)音習(xí)慣的學(xué)習(xí),而語言個(gè)性化主要是指系統(tǒng)可以對(duì)用戶的特定詞匯,例如人名、地名、口頭禪、專業(yè)詞匯等,具備更好的辨識(shí)性。

目前科大訊飛的個(gè)性化識(shí)別技術(shù)已能針對(duì)每個(gè)人的興趣點(diǎn)、知識(shí)背景等來進(jìn)行個(gè)性化語言模型建模,從而準(zhǔn)確識(shí)別出個(gè)性化的詞匯內(nèi)容。以后你用的越多,語音識(shí)別系統(tǒng)就會(huì)越懂你。

方言:無拘束隨心控制

眾所周知,中國的語音及語言博大精深,雖然國家在推廣標(biāo)準(zhǔn)普通話方面不遺余力,但是中國真正掌握標(biāo)準(zhǔn)普通話的人群比例還是比較低的,而中國的口音現(xiàn)象則是紛繁復(fù)雜,同城市中不同口音的情況也很常見。因此,當(dāng)這些帶有或輕或重口音的人群在使用語音輸入時(shí),如果按通常的方法使用標(biāo)準(zhǔn)普通話數(shù)據(jù)進(jìn)行模型的訓(xùn)練,就會(huì)產(chǎn)生很嚴(yán)重的適配問題,從而影響語音輸入時(shí)的識(shí)別效果。

“方言”現(xiàn)在也不再是語音識(shí)別的障礙,得益于各類方言豐富的音頻數(shù)據(jù)、特殊詞匯、發(fā)音現(xiàn)象等專業(yè)資源以及充分利用深度神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)特色,目前,訊飛輸入法已經(jīng)陸續(xù)支持四川話、河南話、東北話、天津話等15種方言識(shí)別,這些方言識(shí)別能力同樣適用于智能家居環(huán)境中。以后,無論你使用普通話還是方言,無論你說話語速快還是慢,普通話標(biāo)不標(biāo)準(zhǔn),在家里都能自由地使用語音控制智能設(shè)備。

語音喚醒:真正解放雙手

由于功耗等方面的限制,智能設(shè)備很難24小時(shí)都保持在激活狀態(tài)。因此,要想在家里自由地控制智能家居設(shè)備,我們還需要能即時(shí)“喚醒”功能,也就是給智能設(shè)備加入“語音喚醒”技術(shù)。

語音喚醒,是指通過含有特定喚醒詞的語音輸入來“觸發(fā)”語音識(shí)別系統(tǒng)以實(shí)現(xiàn)后續(xù)的語音交互。通過該技術(shù),任何人在任何環(huán)境、任何時(shí)間,無論是近場還是遠(yuǎn)場,面向設(shè)備直接說出預(yù)設(shè)的喚醒詞,就能激活產(chǎn)品的識(shí)別引擎,從而真正實(shí)現(xiàn)全程無觸控的語音交互。

除了說單個(gè)喚醒詞實(shí)現(xiàn)喚醒外,更自然便捷、在技術(shù)上更具有挑戰(zhàn)性的交互方式是在連續(xù)語流中帶上喚醒詞,以實(shí)現(xiàn)喚醒產(chǎn)品并同時(shí)實(shí)現(xiàn)操控的效果。目前,語音喚醒方案已在部分產(chǎn)品中取得成功應(yīng)用,比如在靈犀語音助手中,說出“靈犀靈犀,打電話給張三”就可以喚醒設(shè)備并自動(dòng)完成人名識(shí)別與撥打電話。

以上便是小編為各位朋友提供的智能家居語音控制解決方案,希望想要對(duì)此了解的朋友能夠有一定的參考價(jià)值,如果以上信息對(duì)您有用,或者您想要了解更多相關(guān)信息,請繼續(xù)關(guān)注我們智和家,謝謝!

免責(zé)聲明:凡本網(wǎng)注明“來源:XXX(非本網(wǎng))”的作品均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。如稿件版權(quán)單位或個(gè)人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。

本地服務(wù)商

我家裝智能家居要多少錢?馬上算一算

智裝計(jì)算器 今天已有1121 位業(yè)主獲取了智裝預(yù)算

m2

*填寫信息獲取免費(fèi)報(bào)價(jià),智和家承諾您的隱私將被嚴(yán)格保密!

您家的智裝預(yù)算

—— 智和家平臺(tái)報(bào)價(jià)的優(yōu)勢 ——

合作全國2000家智能家居服務(wù)商

平臺(tái)智能生活顧問專業(yè)一對(duì)一服務(wù)

10年智能家居行業(yè)大數(shù)據(jù)積累

m2

*您的信息將被嚴(yán)格保密,絕不會(huì)泄露給第三方!