亞馬遜和谷歌等大公司先后推出智能家居中樞產(chǎn)品,并且都選擇了智能音響作為切入點,推進人工智能落地的戰(zhàn)略。這方面已經(jīng)有很多文章涉及。 這一次,我們從比較專業(yè)的聲學麥克風陣列的角度對比一下這二者的高下,進而引出生態(tài)布局的思考。
在剛剛過去的Google秋季發(fā)布會上,谷歌正式推出了Google Home智能音箱。Google Home將自己的兩大技術(shù)Google Now(智能語音系統(tǒng))與最新版本的Google Assistant(智能服務平臺)結(jié)合打造出的智能音箱。
Google Home作為谷歌最為看重的智能中控出生,并采用了雙麥克風的硬件配置, 售價定為129美元。
眾所周知,2014年亞馬遜推出了第一款智能音箱Amazon Echo,從推出起至今已熱銷超過400萬臺,儼然成為了最新一代的科技寵兒。據(jù)悉,蘋果也即將推出 Siri 智能音箱。各大巨頭和創(chuàng)業(yè)企業(yè),紛紛看中智能家居中控這塊“肥肉”,由此也拉開了人工智能領(lǐng)域新一輪戰(zhàn)役的序幕。
Google Home和Amazon Echo都代表了行業(yè)巨頭通過智能WiFi音箱為入口,推進人工智能落地的戰(zhàn)略。這方面已經(jīng)有很多文章涉及。 這一次,我們從比較專業(yè)的聲學麥克風陣列的角度對比一下這二者的高下,進而引出生態(tài)布局的思考。
雙麥克 vs 多麥克陣列 技術(shù)上各有高下
談及Google Home的硬件配置,不難發(fā)現(xiàn)它和Amazon Echo相比有一個最大的差異,那就是少用了5個麥克風。Amazon Echo采用的是環(huán)形6+1麥克風陣列,而Google Home只采用了2麥克風陣列。
Amazon Echo采用6+1麥克風陣列
麥克風陣列是什么呢?就是放置在空間中不同位置的多個麥克風。根據(jù)聲波傳導理論,利用多個麥克風收集到的信號可以將某一方向傳來的聲音增強或抑制。利用這種方法,麥克風陣列可以將噪聲環(huán)境中特定聲音信號有效的增強。由于麥克風陣列技術(shù)具有很好的抑制噪聲和語音增強的能力,又不需要麥克風時刻指向聲源方向,因此在語音處理領(lǐng)域具有非常好前景,可以用在非常廣的應用領(lǐng)域。
根據(jù)麥克風數(shù)量不同,麥克風陣列具有不同的特點。行業(yè)采用的以雙麥克居多,比如幾乎所有中高端手機都采用雙麥克降噪技術(shù)來提升通話效果。四麥克、六麥克、八麥克線性陣列和環(huán)形陣列在行業(yè)內(nèi)也有應用,但還遠遠達不到雙麥克應用的數(shù)量級。
首先,雙麥克和多麥克陣列的一個重要區(qū)別,是成本的不同。顯然,雙麥克的成本相對多麥克低得多,除了可以直觀觀察到的麥克風數(shù)量不同之外,為了支持多麥克通道而必須具備的硬件電路、為了處理更多的信號數(shù)據(jù)而額外需要的計算能力,都使得成本體現(xiàn)較大的差異。所以我們看到兩者的售價體現(xiàn)的極為明顯,Google Home為129美元,AmazonEcho售價為179.99美元,差價約50美元。值得注意的是,這兩家的硬件產(chǎn)品的戰(zhàn)略沒有多大區(qū)別,都是硬件基本不賺錢。
其次,雙麥克和多麥克的技術(shù)路線區(qū)別較大。雙麥克和多麥克采用的技術(shù)路線雖然有類似之處,但算法體系存在較大區(qū)別。顯然,麥克風越多越容易實現(xiàn)更好的降噪和語音增強效果,所以為了達到同樣或者類似的效果,雙麥克陣列技術(shù)相對多麥克陣列的技術(shù)挑戰(zhàn)性更高。但因為成本問題,采用雙麥克陣列的技術(shù)挑戰(zhàn)雖然大,但從應用普及的角度上卻是大勢所趨。
另外,從效果上看,如果技術(shù)優(yōu)化足夠好,在3~5米的家庭環(huán)境中,雙麥克陣列雖然可以和多麥克陣列做到幾乎一樣的降噪和語音增強效果。但雙麥克有個缺點,就是聲源定位只能定位180°內(nèi)的范圍,而環(huán)形麥克風陣列(不管是4Mic、6Mic還是8Mic)都可以做到360°全角度范圍內(nèi)的定位。所以Google Home只能有四個LED燈來顯示狀態(tài),而Amazon Echo可以用LED燈顯示說話人的方向。當然,這個差別僅對具有聲源定位需求的產(chǎn)品存在影響,而且對一些本來就需要靠墻擺放的設(shè)備如空調(diào)、電視機等是沒有任何問題的。而對于類似機器人等擺放在室內(nèi)中央的產(chǎn)品,如果希望它能定位說話人位置,那就只能采用多麥克方案了。
最后,從產(chǎn)品的角度,雙麥克方案簡單更易落地。多麥克陣列最大的問題是,無論線性陣列還是環(huán)形陣列,其對產(chǎn)品的外觀、結(jié)構(gòu)設(shè)計都有極為嚴苛的要求,因為麥克風是要求必須在空間上均勻分布的。而雙麥克顯然就不必考慮這些因素。
基于雙麥克陣列的產(chǎn)品生態(tài)構(gòu)建更具優(yōu)勢
麥克風陣列作為實現(xiàn)智能語音的必備硬件,可以說是人工智能感知的硬件基礎(chǔ)。因此,麥克風陣列的布局,將深深影響人工智能產(chǎn)品的生態(tài)布局。
首先,眾所周知的是,谷歌是以生態(tài)見長的公司。比如,Android構(gòu)建了整個移動互聯(lián)網(wǎng)的生態(tài)基礎(chǔ)。在谷歌從移動互聯(lián)網(wǎng)向AI轉(zhuǎn)型的時候,提出了“AI First”的口號,并推出了開源深度學習系統(tǒng)TensorFlow,這個系統(tǒng)被認為是人工智能領(lǐng)域的Android。
那么,谷歌為什么在如此重視AI戰(zhàn)略的時候,推出這款Google Home的智能家居產(chǎn)品,并且采用雙麥克的方案呢?相信對于谷歌這樣的公司,成本和技術(shù)絕不會是阻礙他們采用更好技術(shù)的原因。
據(jù)業(yè)內(nèi)人士分析,最關(guān)鍵的就是上面提到的廣泛的適用性和落地的便捷性,可能讓谷歌最后選擇了雙麥克方案。谷歌布局整個智能硬件產(chǎn)業(yè)鏈,而非只打造一款爆款產(chǎn)品,F(xiàn)在做Google Home智能音響,以后也可能做電視、汽車等等,所以在軟硬件選擇上都會考慮更通用、更長遠的方案。多麥克陣列對外觀和結(jié)構(gòu)的嚴苛要求,使得該方案的應用場景極為有限,不具備廣泛的適用性,以Google的遠大抱負,顯然會選擇適應性更強的雙麥克方案。
目前,谷歌明確表示會部分開放對接的子系統(tǒng),包括燈控、溫控器、開關(guān)三大類,媒體分析,谷歌隨后還會提供針對家庭第三方設(shè)備的免費軟件開發(fā)包,以方便鼓勵第三方開發(fā)商增加新的服務功能,提升Google Home的兼容性。以對抗出貨量400萬臺的Echo營造的生態(tài)體系,因為Echo對接的名單已經(jīng)是很長一大串,其中就包括了Nest。
雙麥克陣列在智能家居領(lǐng)域落地最為廣泛
雖然多麥克陣列方案在業(yè)內(nèi)炒的如火如荼,但在落地過程中,雙麥克方案卻成為家電產(chǎn)業(yè)中出貨量最大的方案。據(jù)了解,目前國內(nèi)主流家電廠商應用語音交互技術(shù)的產(chǎn)品中,包括樂視電視、海信電視、格力空調(diào)、美的空調(diào)、華帝煙機等,出貨量最大的產(chǎn)品搭載的都是雙麥克方案。
另外,國內(nèi)的主流人工智能企業(yè)也都在雙麥克方案上重點布局。據(jù)悉,僅云知聲一家企業(yè),目前搭載雙麥克的芯片模組每月的出貨量就超過幾萬片,而科大訊飛目前也在緊鑼密鼓研發(fā)雙麥克方案,爭奪智能家居市場。
據(jù)家電行業(yè)資深技術(shù)人士介紹,從2012年開始行業(yè)內(nèi)就開始尋求語音交互技術(shù)應用在家電產(chǎn)品中,并明確要求:第一、用戶直接通過語音方式控制產(chǎn)品,且不受產(chǎn)品自身噪聲影響;第二、一定距離的遠場語音交互得以實現(xiàn);第三、方案成熟,成本控制。遠場語音交互是關(guān)鍵中的關(guān)鍵。當時市場上普遍解決方案都是八個麥克風收音,雖然語音識別準度得以提高;但實施成本、結(jié)構(gòu)難度、生產(chǎn)安裝等問題卻接踵而來。但像空調(diào)、電視這類家電產(chǎn)品,它永遠都是貼墻放,八個麥克風在實際應用上是多余的。雙麥克技術(shù)在任何產(chǎn)品上均可自然適配。
該人士稱,雙麥克風陣列的結(jié)構(gòu)簡單,成本低、容易實施、功耗低等特點讓它更容易在家電產(chǎn)品中實現(xiàn)落地。相信在未來一段時間內(nèi),雙麥克都將成為智能家居產(chǎn)品中的主流配置。
不同應用場景下自由配置
雖然雙麥克有性價比和結(jié)構(gòu)簡單的種種優(yōu)勢,但并不能完全覆蓋所有場景下的產(chǎn)品需求。
比如,在機器人領(lǐng)域里,對聲源定位的要求比較高,所以一般都會使用環(huán)形多麥克方案。這兩年國內(nèi)比較火的Rokid機器人就采用了8麥克的陣列。
未來人工智能領(lǐng)域還需要更多適配的硬件,以滿足不同智能產(chǎn)品的需求。因此,國內(nèi)像科大訊飛、云知聲等行業(yè)領(lǐng)軍企業(yè)都相繼推出了6+1麥克、4麥克陣列方案,滿足智能音響、機器人領(lǐng)域的產(chǎn)品需求。
從長遠來看,麥克風陣列解決的只是感知這一塊,更快的落地(雙麥克更有優(yōu)勢) 、更多種的形態(tài)(雙麥克和多麥克陣列可配置),是建設(shè)人工智能生態(tài)的第一步。
|