2017年國內外科技圈爆發(fā)了人工智能熱潮,與此同時智能音箱作為連接智能家居的入口,已迅速成為科技巨頭們紛紛角逐的目標。而就國內市場來說,阿里巴巴、騰訊等互聯網巨頭都已經推出屬于自己的智能音箱產品,為開啟智慧家庭打開了大門。不過,話說來回,智能音箱的成功除了“出身”、外觀精美之外,語音識別技術才是掌控用戶與設備交流的大Boss。
就7月發(fā)布的天貓精靈X1而言,這款產品依托于AliGenie操作系統,能夠聽懂中文普通話語音指令,可實現智能家居控制、語音購物、手機充值、叫外賣、音頻音樂播放等功能,帶來人機交互新體驗。而在人工智能的大層面上,其實自然語言處理也是一個重要的研究方向。
從本質上講,自然語言處理,即實現人機間自然語言通信,但實現自然語言理解和自然語言生成是十分困難的,造成困難的根本原因是自然語言文本和對話的各個層次上廣泛存在的各種各樣的歧義性或多義性。當然,目前智能音箱對自然語言處理的探索還處于“正在路上”的階段。不過,隨著技術的不斷發(fā)展,我們有理由相信未來智能音箱能擁有更強的語音識別技術。之所以敢這么篤定,是因為目前已有互聯網巨頭對自然語言處理進行了更深入的挖掘。
阿里巴巴研發(fā)了一款名為conv-RNN的通用推理混合框架,用于文本的語義建模,無縫集成了從卷積和循環(huán)神經網絡結構中提取語言信息的不同方面的優(yōu)點從而加強新框架的理解力,可有效甄別用戶的對話意圖,自主決策對話中的策略,實現“自然語言無縫理解,跨領域自由切換”。
業(yè)內人士表示,阿里在語音交互、語義理解方面動作頻頻,不排除進入消費級產品領域,如車載語音助手、智能音響等,與亞馬遜、蘋果等科技公司展開正面競爭。以目前情形來看,阿里已經在智能音箱產品上發(fā)力,未來阿里人工智能實驗室下的天貓精靈系列產品有望擁有更強大的語音識別能力,AI更懂你將不再是難題。
|