語(yǔ)音技術(shù)是人工智能的支撐,語(yǔ)音識(shí)別,控制和WiFi/藍(lán)牙是應(yīng)用的主要技術(shù)組成。而在如今的智能家居市場(chǎng),語(yǔ)音技術(shù)的發(fā)展也為控制入口做了一個(gè)補(bǔ)充,在拋去了傳統(tǒng)遙控器和手機(jī)APP之后,通過(guò)口令發(fā)送讓家居環(huán)境達(dá)到舒適狀態(tài),讓生活更便捷智能。遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別、云端語(yǔ)義辨識(shí)、人工智能應(yīng)用等等一個(gè)個(gè)技術(shù)節(jié)點(diǎn)得到新的突破,為智能家居提供了新的控制入口選擇。本文從語(yǔ)音技術(shù)現(xiàn)狀出發(fā),結(jié)合具體方案產(chǎn)品應(yīng)用、項(xiàng)目實(shí)施等多角度為您呈現(xiàn)語(yǔ)音控制技術(shù)在智能家居產(chǎn)品中的應(yīng)用前景。
目前語(yǔ)音技術(shù)在智能家居存在的技術(shù)難點(diǎn)
智能家居技術(shù)難點(diǎn):一、距離是障礙;二、語(yǔ)音交互差,識(shí)別率低;三、地區(qū)方言多,語(yǔ)義識(shí)別難。在智能家居環(huán)境中,用戶和智能終端之間的距離被大大增加了,用戶能隨意用語(yǔ)音控制智能家居的一個(gè)必要條件就是在無(wú)論你在客廳哪個(gè)角落發(fā)出指令,設(shè)備都能準(zhǔn)確的識(shí)別,語(yǔ)音識(shí)別技術(shù)必須突破距離的障礙。而且目前室內(nèi)的語(yǔ)音交互受到背景噪音、其他人聲干擾、回聲、混響等多重復(fù)雜因素影響,導(dǎo)致識(shí)別率低甚至無(wú)法使用,只能在相對(duì)安靜、近距離的環(huán)境下使用。除此之外,單是中國(guó)語(yǔ)系、方言和口音就相當(dāng)多,加上中文的多語(yǔ)義性,所以不同地區(qū)的人使用語(yǔ)音控制識(shí)別率差異較大。同時(shí),在語(yǔ)義識(shí)別上,也存在上下文的關(guān)聯(lián)帶來(lái)識(shí)別的學(xué)習(xí)難、定位難和建立模型難等問(wèn)題。
語(yǔ)音控制技術(shù)解決語(yǔ)音識(shí)別障礙與痛點(diǎn)
近場(chǎng)/遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別技術(shù):近場(chǎng)語(yǔ)音識(shí)別,需要用戶點(diǎn)擊啟動(dòng),并且用戶與終端設(shè)備的距離比較近,如手機(jī)或其他終端設(shè)備,可直接借助這些終端設(shè)備的實(shí)現(xiàn)控制功能。遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別,以麥克風(fēng)陣列遠(yuǎn)距離拾取的語(yǔ)音數(shù)據(jù)作為輸入數(shù)據(jù),通過(guò)語(yǔ)音識(shí)別的算法將語(yǔ)音信號(hào)轉(zhuǎn)寫成文字的技術(shù)。
喚醒目標(biāo)檢測(cè)技術(shù):使用的麥克風(fēng)陣列波速成形算法,將360 度空間垂直劃分成若干區(qū)域,每個(gè)麥克風(fēng)負(fù)責(zé)檢測(cè)一個(gè)指定的區(qū)域。當(dāng)某個(gè)空間區(qū)域里面檢測(cè)到有喚醒詞出現(xiàn)時(shí),對(duì)應(yīng)于該空間區(qū)域的麥克風(fēng)拾音功能就被增強(qiáng),其他區(qū)域的麥克風(fēng)拾音就被抑制。從而實(shí)現(xiàn)了對(duì)聲音進(jìn)行有方向有角度的拾取,避免了周圍電視機(jī)里的說(shuō)話聲音、其他人交談對(duì)語(yǔ)音指令的影響。
播放狀態(tài)打斷技術(shù):在對(duì)音箱等設(shè)備進(jìn)行語(yǔ)音控制時(shí),往往該設(shè)備處于播放歌曲的狀態(tài)。由于麥克風(fēng)安裝在音箱上,麥克風(fēng)和說(shuō)話人之間的距離要遠(yuǎn)大于麥克風(fēng)和揚(yáng)聲器之間的距離,在這樣的情況下,采用內(nèi)外兼顧的方法進(jìn)行解決。內(nèi)部使用特殊的回聲消除算法從內(nèi)部減小噪音對(duì)麥克風(fēng)的影響。
三大智能家居語(yǔ)音方案為開(kāi)發(fā)者提供創(chuàng)新思路
正如上文所說(shuō),語(yǔ)音識(shí)別技術(shù)已經(jīng)解決了當(dāng)前主要的識(shí)別障礙,發(fā)展到相當(dāng)成熟的階段。如今隨著人工智能的浪潮來(lái)襲,基于語(yǔ)音技術(shù)衍生出來(lái)的創(chuàng)意方案也如雨后春筍般涌現(xiàn)。為了快速接入人工智能的風(fēng)口,尋找創(chuàng)新種子共同孵化出創(chuàng)新的語(yǔ)音方案并推向市場(chǎng)。我愛(ài)方案網(wǎng)、快包與科大訊飛聯(lián)合推出智能語(yǔ)音設(shè)計(jì)大賽。大賽報(bào)名伊始,便受到行業(yè)熱烈關(guān)注,報(bào)名參賽的個(gè)人以及團(tuán)體絡(luò)繹不絕,參賽人群包括初創(chuàng)公司、學(xué)生、資深工程師等各行業(yè)群體,目前已經(jīng)陸陸續(xù)續(xù)收到60多個(gè)參賽項(xiàng)目,現(xiàn)在我們從中挑選一些應(yīng)用在智能家居行業(yè)的創(chuàng)意方案給開(kāi)發(fā)者提供創(chuàng)新思路。
方案名稱:降噪聲控智能交互設(shè)備——實(shí)現(xiàn)聲控,替代遙控器
應(yīng)用場(chǎng)景與創(chuàng)意:用于智能家居語(yǔ)音識(shí)別,實(shí)現(xiàn)聲控,替代遙控器。由于在與智能設(shè)備交互的過(guò)程中,存在許多的局限。如需要電腦,智能手機(jī)等額外設(shè)備(不能隨時(shí));交互平臺(tái)操作不能針對(duì)不同人群,交互平臺(tái)復(fù)雜等問(wèn)題。開(kāi)發(fā)者想做一款聲控的交互平臺(tái),將用到科大訊飛的語(yǔ)音聽(tīng)寫、語(yǔ)言喚醒、命令詞識(shí)別、聲紋識(shí)別四大智能語(yǔ)音技術(shù)。
開(kāi)發(fā)者/參賽人:該項(xiàng)目的開(kāi)發(fā)人員蘇先生是一名工作不到兩年的年輕工程師哦,別看蘇先生從事研發(fā)時(shí)間不長(zhǎng),卻已經(jīng)擁有非常豐富的開(kāi)發(fā)經(jīng)驗(yàn)啦!據(jù)介紹,它在從業(yè)的這兩年里,已經(jīng)完成過(guò)wifi相機(jī)研發(fā)、熱成像相機(jī)研發(fā)、線陣相機(jī)研發(fā)等多個(gè)項(xiàng)目的開(kāi)發(fā)。
方案名稱:帶紅外轉(zhuǎn)發(fā)控制的家庭語(yǔ)音中心
應(yīng)用場(chǎng)景與創(chuàng)意:定位是放在用戶客廳茶幾上的智能家居語(yǔ)音中樞,通過(guò)語(yǔ)音轉(zhuǎn)紅外,可以讓用戶直接用語(yǔ)音控制電視,空調(diào)等紅外遙控設(shè)備。另外,通過(guò)與酷宅云的聯(lián)動(dòng),實(shí)現(xiàn)云端打通,還能支持通過(guò)語(yǔ)音來(lái)控制其他各種易微聯(lián)SUPPORT的wifi用電器,包括風(fēng)扇,加濕機(jī),吊頂燈等。從而實(shí)現(xiàn)一個(gè)語(yǔ)音入口,對(duì)超過(guò)180個(gè)品牌超過(guò)300種產(chǎn)品進(jìn)行直接語(yǔ)音控制。
開(kāi)發(fā)者/參賽人:擅長(zhǎng)智能家居硬件及整套云平臺(tái)的開(kāi)發(fā),尤其是全球化的云平臺(tái)開(kāi)發(fā),是國(guó)內(nèi)不多的打通亞馬遜Echo支持和谷歌Nest平臺(tái)的團(tuán)隊(duì)。成功案例,為ITEAD提供的Sonoff產(chǎn)品線智能硬件及服務(wù)器方案,超過(guò)50萬(wàn)海外用戶在使用。還為國(guó)內(nèi)超過(guò)100個(gè)品牌的家電廠商提供各種智能硬件升級(jí)服務(wù),超過(guò)300款產(chǎn)品成功上市。
方案名稱:基于命令詞識(shí)別的廣播電視數(shù)字電視機(jī)頂盒
應(yīng)用場(chǎng)景與創(chuàng)意:本項(xiàng)目主要應(yīng)用的場(chǎng)景是家庭成員通過(guò)語(yǔ)音對(duì)數(shù)字電視機(jī)頂盒、LED電視機(jī)及家庭智能產(chǎn)品進(jìn)行操控,提升家庭成員生活便利。產(chǎn)品與現(xiàn)有廣播電視DVB數(shù)字電視機(jī)頂盒進(jìn)行集成,形成一體化產(chǎn)品,實(shí)現(xiàn)對(duì)數(shù)字電視機(jī)頂盒的直接操控,并通過(guò)紅外轉(zhuǎn)發(fā)頭,對(duì)LED電視機(jī)及其他智能產(chǎn)品的操控。作為產(chǎn)品后續(xù)的延續(xù)應(yīng)用,主要是通過(guò)AIUI提升智能化,形成以語(yǔ)音為核心的家庭智能化中心。
開(kāi)發(fā)者/參賽人:長(zhǎng)期于數(shù)字機(jī)頂盒相關(guān)技術(shù)工作,2016年的其中一個(gè)開(kāi)發(fā)項(xiàng)目是基于60G的數(shù)字機(jī)頂盒高清視頻音頻傳輸平臺(tái),該項(xiàng)目獲行業(yè)創(chuàng)新獎(jiǎng)。
看到了以上優(yōu)秀的創(chuàng)意項(xiàng)目,你是否也有想要拿一塊科大訊飛的開(kāi)發(fā)板做項(xiàng)目的沖動(dòng)呢?該活動(dòng)目前還在報(bào)名征集中哦,報(bào)名入口
http://www.52solution.com/index.php/Home/Special/kdxf。此次大賽從2016年11月17日開(kāi)始,報(bào)名截止時(shí)間12月15日。面向全國(guó)開(kāi)發(fā)者、科技企業(yè)、科研機(jī)構(gòu)、高效學(xué)生、創(chuàng)客等群體。入圍者還可以獲得6萬(wàn)現(xiàn)金大獎(jiǎng)+科大訊飛價(jià)值10萬(wàn)開(kāi)發(fā)板以及10萬(wàn)的語(yǔ)音優(yōu)質(zhì)資源!