當(dāng)前位置: 首頁(yè)  >  熱點(diǎn)關(guān)注 > 正文

百度開(kāi)放四項(xiàng)全新語(yǔ)音技術(shù) 將為人機(jī)交互帶來(lái)巨大改變

來(lái)源:中國(guó)新聞網(wǎng) 作者:      2016-11-22

  中新網(wǎng)11月22日電 11月22日,百度宣布在其語(yǔ)音開(kāi)放平臺(tái)上線三周年之際,向公眾開(kāi)放四項(xiàng)全新語(yǔ)音技術(shù)的接口,以使用戶在使用語(yǔ)音與機(jī)器進(jìn)行交流時(shí),享受到更奇妙的交互體驗(yàn)。

  百度公司首席科學(xué)家吳恩達(dá)在演講中對(duì)百度最新的語(yǔ)音技術(shù)進(jìn)展表示滿意,他簡(jiǎn)單介紹了這四項(xiàng)深具革命性的語(yǔ)音技術(shù),即情感合成、遠(yuǎn)場(chǎng)方案、喚醒二期技術(shù)和長(zhǎng)語(yǔ)音方案,并宣布即日起百度將這幾項(xiàng)技術(shù)免費(fèi)開(kāi)放給用戶和開(kāi)發(fā)者共享。

 

 ?。ò俣裙臼紫茖W(xué)家吳恩達(dá)進(jìn)行現(xiàn)場(chǎng)演講)

  “這些技術(shù)有很大的潛力,去徹底改變?nèi)藱C(jī)交互的效率和辦法。未來(lái)語(yǔ)音技術(shù)在很多應(yīng)用場(chǎng)景有很好的機(jī)會(huì),將為人機(jī)交互帶來(lái)巨大的改變?!眳嵌鬟_(dá)表示。

  這些技術(shù)旨在解決用戶在使用語(yǔ)音交互的場(chǎng)合時(shí),普遍感到困擾的一些關(guān)鍵問(wèn)題。例如,百度情感合成技術(shù)主要聚焦在為合成語(yǔ)音“加入情感”,目前可達(dá)到接近真人發(fā)聲效果,百度今年早些時(shí)候曾利用此技術(shù),復(fù)原已逝明星張國(guó)榮的聲音。

  類似地,開(kāi)發(fā)者還可以利用新的接口,使語(yǔ)音識(shí)別距離增加到3-5米,將設(shè)備的語(yǔ)音喚醒率提升到95%以上同時(shí)更省電誤報(bào)更少,或提升長(zhǎng)時(shí)間語(yǔ)音識(shí)別的準(zhǔn)確率問(wèn)題。這將為語(yǔ)音技術(shù)帶來(lái)遠(yuǎn)比現(xiàn)在更多的想象空間,而不只是遙控電視或解鎖手機(jī)。

  例如,前兩者的代表是百度的“小度機(jī)器人人機(jī)語(yǔ)音交互點(diǎn)餐”,已在上??系禄炫灥晖度霊?yīng)用,可遠(yuǎn)距離隨時(shí)應(yīng)答點(diǎn)餐。后者則已經(jīng)在諸多內(nèi)容記錄、智能客服、視頻轉(zhuǎn)寫(xiě)等應(yīng)用場(chǎng)景表現(xiàn)出巨大的想象空間。

 

 

 ?。ā皹O智開(kāi)放·共語(yǔ)未來(lái)——百度語(yǔ)音開(kāi)放平臺(tái)3周年慶”現(xiàn)場(chǎng))

  在這場(chǎng)名為“極智開(kāi)放?共語(yǔ)未來(lái)”的慶典上,來(lái)自斯坦福大學(xué)的人工智能專家James Landay,也分享了一項(xiàng)與百度合作的最新研究成果,該研究發(fā)現(xiàn)智能手機(jī)在語(yǔ)音輸入時(shí),輸入速度比鍵盤(pán)輸入快3倍。他表示,“近兩年,受益于大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)的不斷發(fā)展,語(yǔ)音識(shí)別技術(shù)突飛猛進(jìn),速度及準(zhǔn)確性都有了長(zhǎng)足進(jìn)步?!?/p>

  吳桂林打開(kāi)視頻應(yīng)用“愛(ài)奇藝”的手機(jī)客戶端,說(shuō)“VIP續(xù)費(fèi)”,系統(tǒng)準(zhǔn)確跳轉(zhuǎn)到了相應(yīng)的充值頁(yè)。這位愛(ài)奇藝技術(shù)總監(jiān)指出,借助百度語(yǔ)音開(kāi)放平臺(tái),每天有百萬(wàn)以上的愛(ài)奇藝用戶使用語(yǔ)音搜索,其中80%以上轉(zhuǎn)化為有效點(diǎn)擊。

  讀者甘肅數(shù)碼科技有限公司總經(jīng)理金大時(shí)認(rèn)為,語(yǔ)音開(kāi)放平臺(tái)的價(jià)值并不止于商業(yè)?!白x者數(shù)字農(nóng)家書(shū)屋”已在甘肅慶陽(yáng)市試點(diǎn)成功,完成了65個(gè)新農(nóng)村“數(shù)字農(nóng)家書(shū)屋”。他表示,“很多不識(shí)字的老年人和留守兒童,語(yǔ)音合成讓他們也享受到了閱讀的樂(lè)趣?!?/p>

 

 ?。ò俣日Z(yǔ)音開(kāi)放平臺(tái)宣布四大語(yǔ)音新技術(shù)開(kāi)放)

  目前,百度語(yǔ)音開(kāi)放平臺(tái)的合作伙伴已涵蓋多個(gè)領(lǐng)域和場(chǎng)景,包括智能手機(jī)領(lǐng)域的聯(lián)想、中興;智能家居領(lǐng)域的長(zhǎng)虹智能電視、康佳智能電視、SONY智能電視;汽車行業(yè)的特斯拉、途勝;智能設(shè)備領(lǐng)域的惠普、艾米通訊;智能服務(wù)領(lǐng)域的攜程、手機(jī)QQ閱讀等。

  “語(yǔ)音是人類交流最自然的方式,通過(guò)開(kāi)放語(yǔ)音技術(shù),百度希望可以引領(lǐng)語(yǔ)音功能產(chǎn)品的繁榮發(fā)展?!眳嵌鬟_(dá)表示。

  作為國(guó)內(nèi)最為開(kāi)放的領(lǐng)先語(yǔ)音技術(shù)開(kāi)放平臺(tái),百度語(yǔ)音開(kāi)放平臺(tái)自2013年10月上線以來(lái),每日在線語(yǔ)音識(shí)別要求從2013年的500萬(wàn)上升到今天的1億4千萬(wàn),在線語(yǔ)音合成每日請(qǐng)求達(dá)2億,開(kāi)發(fā)者數(shù)量超過(guò)14萬(wàn)。

  在技術(shù)指標(biāo)方面,百度語(yǔ)音識(shí)別準(zhǔn)確率目前已高達(dá)97%,居于全球領(lǐng)先。今年2月,百度深度語(yǔ)音識(shí)別系統(tǒng)Deep Speech 2入選MIT 2016十大突破技術(shù)。包括語(yǔ)音技術(shù)在內(nèi)的百度大腦,入選2016第三屆烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)15大領(lǐng)先科技成果,成為國(guó)內(nèi)唯一入選的綜合型人工智能技術(shù)。

【責(zé)任編輯:天亮】

掃一掃關(guān)注北疆風(fēng)韻微信公眾號(hào)

微信