2017年4月20日,由京東與科大迅飛共同出資的北京靈隆科技有限公司正式發(fā)布《第三方平臺接入叮咚語音交互系統(tǒng)用戶體驗標準》,這也是我國首份在智能語音領(lǐng)域針對第三方服務(wù)和內(nèi)容接入語音交互系統(tǒng)的開發(fā)標準。這標志著未來在智能家居等領(lǐng)域,語音交互接口將能夠更加快速、簡潔地接入,為用戶提供更加智能高效的使用體驗。
靈隆科技是由京東和科大訊飛共同出資的、致力于AI智能硬件產(chǎn)品研發(fā)的高科技公司,其中最具代表性的莫過于叮咚智能音箱,該產(chǎn)品包含針對家用的A系列產(chǎn)品以及針對便攜的Q系列產(chǎn)品。而在2017年,靈隆科技也將發(fā)布全新單品,為企業(yè)和用戶帶來更加智能的語音交互產(chǎn)品。
叮咚智能音響帶來的智能語音最大的亮點便是能夠完全解放你的雙手,完美的語音交互系統(tǒng)令用戶能夠深切感受到人工智能帶來的魅力。而叮咚智能音響最大的魔力便是針對智能家居的控制作用,如果把家居比作人,那么叮咚智能音響就好比大腦,作為整個身體的中樞神經(jīng)控制系統(tǒng)來實現(xiàn)智能生活。
當(dāng)然基于音響的固有性質(zhì),叮咚智能音響還為用戶提供了非常豐富的有聲內(nèi)容,包括喜馬拉雅、百度音樂、互動百科等應(yīng)用,包括海量的音樂、有聲小說等資源,當(dāng)然很多云端的內(nèi)容也必不可少,比如如果你想聽邏輯思維了,那么叮咚音響便能夠瞬間幫助你調(diào)用出來,十分方便。
第三方開放平臺:實現(xiàn)智能生活的紐帶
如果說智能語音交互只是人工智能在智能家居領(lǐng)域最基礎(chǔ)的功能表現(xiàn),那么靈隆科技所研發(fā)的第三方開放平臺才是真正實現(xiàn)智能家居的關(guān)鍵。據(jù)悉,早在2016年10月,靈隆科技旗下基于叮咚智能音響研發(fā)的第三方開放平臺便正式上線,目前整個開放平臺已經(jīng)涵蓋智能家居、辦公商務(wù)、生活助理、家政、購物、教育、游戲等七大領(lǐng)域,數(shù)十款應(yīng)用已經(jīng)可以在線上進行實際體驗。
那么究竟什么是第三方開放平臺?對此,玲瓏科技相關(guān)負責(zé)人表示,“第三方開放平臺是完全對外開放的,任何無論機構(gòu)還是個人的開發(fā)者,都可以通過靈隆科技的第三方開放平臺賦予叮咚智能音箱更多的能力”。換句話說,叮咚智能音箱一直在“學(xué)習(xí)”,令自己成為真正的中樞控制神經(jīng)。
而在實際原理方面,第三方廠家只需要做其產(chǎn)品后端服務(wù)的接入,而叮咚智能音箱就瞬間轉(zhuǎn)換成了麥克風(fēng)和播放器的作用,經(jīng)過叮咚智能音箱的語音語義處理之后,反饋給第三方廠家,第三方廠家得到用戶具體的意圖之后,再進行相應(yīng)的處理,返回給叮咚音箱,叮咚音箱再把處理的結(jié)果告訴用戶,因此叮咚智能音箱能夠觸及到業(yè)務(wù)的廣度和深度就會隨著進一步擴大,這也是靈隆科技提出開放式平臺的初衷。
《第三方平臺接入叮咚語音交互系統(tǒng)用戶體驗標準》:屬于人工智能的語言
從人工智能角度來講,語音識別是最簡單的,而語義的理解本身是難的,因此為了能夠令叮咚智能音響真正理解用戶的意圖,以真正實現(xiàn)第三方開放平臺的普及,一套相應(yīng)的語言標準是必不可少的,這是屬于人工智能語言,也是智能語音交互的基礎(chǔ)。
也正因如此,靈隆科技發(fā)布了《第三方平臺接入叮咚語音交互系統(tǒng)用戶體驗標準》,該標準進一步明確了人機交互的反饋流程和設(shè)計標準,其中定義了兩個智能語音交互的關(guān)鍵指標,即“語義”和“意圖”,通過語義和意圖的轉(zhuǎn)化來完成交互的核心步驟。
當(dāng)前,人機主要交互模式是界面交互,通過“一對一”的指令溝通。而語音交互則不同,由于不同地域、不同文化、不同表達習(xí)慣,在人機交互過程中往往是“多對一”的指令溝通。也就是說同一種意圖,在用戶那里會有多種形式的提問方式,這就要求語音交互必須大量學(xué)習(xí)人們的日常語言習(xí)慣,甚至做到理解用戶的語義的“弦外之音”。這對機器來說無疑是巨大的挑戰(zhàn)。
在語音交互流程設(shè)計及體驗中,叮咚主要研究的是識別用戶語義意圖、反饋用戶語音需求,處理人機對話錯誤三個方面。對于研究成果,在《標準》的第三部分做了進一步闡述,從如何更好的獲得用戶意圖、如何將信息更好的展現(xiàn)給用戶和如何更好的處理對話中的錯誤進行解釋,并通過實例和講解相配合的模式整個報告內(nèi)容清晰易讀易懂,為第三方服務(wù)接入提供了切實可遵循的規(guī)范標準。
寫在最后:
軟硬實力的完美結(jié)合是對靈隆科技最好的詮釋,靈隆科技在叮咚智能音響(硬實力)的基礎(chǔ)上,通過第三方開放平臺(軟實力)整合資源,以標準的人工智能語言為用戶和企業(yè)帶來真正的智能生活。當(dāng)然,方言等問題是智能語音交互中無法避免的問題,但我們有理由相信,在靈隆科技這樣的企業(yè)推動下,“機器人”將能夠更懂我們,也更懂我們的生活。
|