色接九九精品国产免费_久久精品视频国产片十八_亚洲日韩国产麻豆_亚洲日本一区二区三区在线观看

服務(wù)熱線:400-6787-160
音響網(wǎng)(Audio160.com) > 行業(yè)資訊 > (其它) > 新思路|新器件帶給遠(yuǎn)場語音識別的新希望!
新思路|新器件帶給遠(yuǎn)場語音識別的新希望!
更新時(shí)間:2016-7-25 14:00:57 編輯:溫情 文章來源:音響網(wǎng) 調(diào)整文字大小:【
[導(dǎo)讀] 語音識別領(lǐng)域已經(jīng)取得了許多重大進(jìn)展,但是,距離機(jī)器人與人類真正的自由交流,卻還有許多難題需要解決,其中的難題之一就是遠(yuǎn)場語音識別。

  語音識別領(lǐng)域已經(jīng)取得了許多重大進(jìn)展,但是,距離機(jī)器人與人類真正的自由交流,卻還有許多難題需要解決,其中的難題之一就是遠(yuǎn)場語音識別。

  目前,計(jì)算機(jī)將語音轉(zhuǎn)換為文字,僅限近講的情況,一旦人與麥克風(fēng)相距較遠(yuǎn),有混響或噪聲存在的情況下,語音識別率急劇降低,特別是有混響的情況,更對語音識別提出挑戰(zhàn),這與人有著極大的不同。也就是說在有適當(dāng)混響的情況下,人會感覺聲音飽滿,聽得更加清楚,而對于計(jì)算機(jī),機(jī)器人,卻恰恰相反。還有,眾所周知的雞尾酒效應(yīng)中,我們?nèi)祟愂蔷哂幸环N聽力選擇能力的,形象的描述就是在一個(gè)雞尾酒會上,人可以將注意力集中在某一個(gè)人的談話上,而忽略周圍人的談話及背景噪聲。盡管周邊的噪聲很大,我們?nèi)匀豢梢月牭轿覀兏信d趣的說話內(nèi)容。這種能力我們每個(gè)人都有,但要讓機(jī)器也具有這種能力,卻是非常困難的。

  現(xiàn)有解決方案

  近半個(gè)世紀(jì)以來,科學(xué)家一直在致力于解決這個(gè)難題。目前,解決機(jī)器聽覺系統(tǒng)的雞尾酒會效應(yīng)主要有兩個(gè)研究方向。

  第一種是聽覺場景分析,主要是基于音頻特征及語言模型對混在一起的語音進(jìn)行分離。例如:可以利用語音信號諧波特性、短時(shí)平穩(wěn)特性、隱馬爾科夫語言模型,實(shí)現(xiàn)將混在一起的談話聲分離。但是,這種方法的缺點(diǎn)之一是對語音進(jìn)行了一些不合理的假設(shè),如不同人的說話聲在頻譜上是不重疊的。而且除此之外,基于語言模型的估計(jì)方法運(yùn)算量又很大,難以實(shí)用。

  第二種是基于麥克風(fēng)陣列的方法,利用麥克風(fēng)陣列設(shè)計(jì)空間濾波器,實(shí)現(xiàn)對特定方向聲源的提取,并抑制其他方向上語音,從而達(dá)到對不同位置的聲音進(jìn)行分離的目的,缺點(diǎn)是需要多個(gè)麥克風(fēng)且計(jì)算復(fù)雜。

  未來解決方案

  顯然,上述的現(xiàn)有兩個(gè)解決方案都不能達(dá)到令我們滿意的程度。然而,最近美國杜克大學(xué)的學(xué)者給我們帶來了新的希望。

  通過將聲學(xué)材料及壓縮感知技術(shù)結(jié)合發(fā)明的一種新型器件,不僅使得單個(gè)麥克風(fēng)就可以實(shí)現(xiàn)對三個(gè)混合聲源的分離,而且,其正確率可以達(dá)到96.67%。新器件與傳統(tǒng)的信號處理方法不同,它是通過設(shè)計(jì)精妙的聲學(xué)材料實(shí)現(xiàn)對不同方向的聲源進(jìn)行編碼,且不需要對聲源有任何先驗(yàn)知識或假設(shè)。

  該新器件是由一個(gè)塑料圓盤構(gòu)成,外形十分類似一個(gè)披薩。圓盤的中心放置一個(gè)麥克風(fēng),麥克風(fēng)周圍由36個(gè)扇形的通道組成,每個(gè)通道都是一個(gè)聲波導(dǎo),由許多蜂窩狀的結(jié)構(gòu)組成。每個(gè)通道都能夠把經(jīng)過它的聲波進(jìn)行調(diào)制,因此,整體結(jié)構(gòu)類似于一個(gè)參數(shù)可調(diào)的均衡器。

  圓盤的工作原理,與你對著一個(gè)裝著水的瓶子說話時(shí)的情景很類似。由于聲波振動(dòng)的影響,瓶子內(nèi)部的空氣會發(fā)生共振,從而聲音某些頻率的能量會被衰減,而衰減的頻率值由瓶內(nèi)水的多少?zèng)Q定。圓盤的每個(gè)通道都類似于一個(gè)裝著水的瓶子,通過精妙的設(shè)計(jì)每個(gè)通道中的蜂窩狀晶格的高低大小就可以實(shí)現(xiàn)對聲音不同頻率的能量進(jìn)行衰減,從而達(dá)到對聲波編碼的目的。

  不過,由于新器件的尺寸較大,目前還難以在實(shí)際中獲得很好的應(yīng)用。但試想一下,一旦該器件可以小型化,它將取代目前通用的麥克風(fēng)陣列技術(shù)。利用單個(gè)麥克風(fēng),且不需要進(jìn)行復(fù)雜的計(jì)算就可以實(shí)現(xiàn)在嘈雜的環(huán)境下提取感興趣的語音,這是一件多么美妙的事情。

更多相關(guān): 新思路新器件語音識別
 網(wǎng)友評論
 編輯推薦
  • 2019視聽行業(yè)萬里行之走進(jìn)企業(yè)武漢
  • 2019視聽行業(yè)萬里行之武漢
  • 北京InfoComm China 2019展會
  • 獨(dú)家策劃:北京IFC2019不落幕展精彩搶先看
  • dBTechnologies品牌故事:核心競爭力來自原創(chuàng)和性能
  • 精益求精,締造完美品質(zhì)—George Krampera,一生追求完美聲音
  • Crest Audio(高峰)-站在創(chuàng)新的高度 俯瞰市場之所需
  • KV2 Audio:音頻行業(yè)的先行者
設(shè)為首頁 | 商務(wù)信息 | 音響資訊 | 本站動(dòng)態(tài) | 付款方式 | 關(guān)于音響網(wǎng) | 網(wǎng)站地圖 | 網(wǎng)站RSS | 友情鏈接
本站網(wǎng)絡(luò)實(shí)名:音響網(wǎng) 國際域名:ubl777.com 版權(quán)所有.1999-2019 深圳市中投傳媒有限公司 .
郵箱:web@audio160.com  電話:0755-26751199(十二線) 傳真:0755-86024577
在線客服:點(diǎn)擊這里給我發(fā)消息 點(diǎn)擊這里給我發(fā)消息  點(diǎn)擊這里給我發(fā)消息  點(diǎn)擊這里給我發(fā)消息   視聽學(xué)院-商家論壇群: 視聽學(xué)院-商家論壇