百度開放大批語音黑科技,人機互動大變革將至

summerbabycute     2016-11-24     0     檢舉

11月22日,百度語音開放平台三周年慶活動在京舉辦,百度宣布將向公眾開放四個全新的語音技術接口。據百度公司首席科學家吳恩達介紹,這四項語音技術分別為情感合成、遠場方案、喚醒二期技術和長語音方案,即日起這幾項旨在提升語音交互用戶體驗和推動語音交互落地普及的技術,將免費開放給用戶和開發者共享。

智能語音交互,前景與問題交織

智能語音交互作為一個依仗新興技術而誕生髮展的行業,不僅有著充足的發展潛力,更隨著近年相關技術的快速疊代迎來了爆發期。

中國工信部的報告指出,2016年全球智能語音產業規模為82.3億美元,近五年復合增長率高達35.1%,而根據Research and Markets 發布的調查數據顯示,2020年全球智能語音市場規模預計將達到191.7億美元。因此對於科技巨頭來說,這一領域已經成為兵家必爭之地。

事實上國內外諸多科技巨頭近年來都已意識到了語音交互行業的發展潛力,並紛紛在這一領域大展拳腳。亞馬遜旗下家庭智能語音交互產品Amazon Echo就幫助其占據了智能家居語音交互領域的半壁江山,蘋果的Sir更以問答交互形式開啟了語音交互新世界的大門,除此之外,微軟、谷歌、Facebook、百度、訊飛等國內外巨頭都早已在這一領域爭相競逐。

但在巨頭紛紛布局的今天,智能語音行業仍然存在不少問題。語音交互產品在識別快速話語時,往往或難以識別或頻頻出錯,而這與開發者語音識別技術的不到位有著直接關係。此外,語音交互助手目前的應用場景仍然談不上寬泛,當前一些已知的應用場景不要說智能化,甚至給人一種生搬硬造應用場景的感覺。

事實上,不同於移動網際網路技術的全面開花,當前的智能語音交互行業很大程度上都是各家企業在閉門造車,行業環境不夠開放是最大的問題。技術上的缺乏交流制約著行業的進一步提升。而本次百度開放關鍵性技術則對改善上述問題明顯有著重要意義,通過多項關鍵技術的開源共享,行業死水將被盤活,當前行業因技術障礙存在的問題,比如語音識別距離短,語音喚醒率不盡如人意等勢必將得到改善。【CNYPAI 華人充值 折扣碼:666 (>$50) 長期有效】