0
本文作者: 呂倩 | 2017-08-09 18:00 |
搜狗推出了一款真正落地的語音技術(shù)產(chǎn)品。
8月8日,搜狗針對文字工作者,推出語音實(shí)時(shí)轉(zhuǎn)文字的速記工具“搜狗聽寫”。適用于寫文章、采訪錄音、會(huì)議記錄、筆記整理 、日常記事等場景,幫助用戶實(shí)現(xiàn)語音記錄和信息輸入。針對不同場景和需求,搜狗聽寫可以支持“聽寫”和“轉(zhuǎn)寫”兩種模式。在“聽寫”模式下,錄音的同時(shí)即可實(shí)時(shí)給出識別結(jié)果;而“轉(zhuǎn)寫”模式下則可以離線錄音,錄音完成后一次性獲取文字結(jié)果。
為了提高文字整理效率,搜狗聽寫還加入了邊聽邊改、無線標(biāo)重點(diǎn)(藍(lán)牙打點(diǎn))、多端同步、信息分享等人性化功能,與搜狗輸入法個(gè)人詞庫打通。此外,搜狗公司語音交互技術(shù)中心總經(jīng)理王硯峰宣稱,搜狗聽寫還提供耳語識別技術(shù),在說話音量低至30分貝時(shí),依然可以準(zhǔn)確識別。
早在2012年,搜狗即開始研發(fā)智能語音技術(shù),并同步開啟相關(guān)產(chǎn)品落地的布局。去年8月3日,搜狗舉行知音引擎的發(fā)布會(huì),取得機(jī)器翻譯的突破。跟進(jìn)當(dāng)時(shí)世界上最領(lǐng)先的機(jī)器翻譯的深度學(xué)習(xí)的框架,基于attion的端到端的框架,再加上以前在語音識別上的累積,用3個(gè)月的時(shí)間搭建起機(jī)器翻譯引擎,并且應(yīng)用到了去年的烏鎮(zhèn)大會(huì)上。
去年11月份,搜狗推出了機(jī)器同傳,率先商用化。今年1月份,推出行業(yè)首個(gè)跨引擎搜索引擎,也是基于機(jī)器翻譯核心引擎推出。5月份,搜狗語音核心技術(shù)在應(yīng)用方面取得突破等。
實(shí)際上,目前市場上已有一些同類的產(chǎn)品,例如早期推出的訊飛聽見等,相比之下,搜狗是否存在優(yōu)勢呢?搜狗語音交互中心負(fù)責(zé)人王硯峰對雷鋒網(wǎng)表示:
第一,訊飛對應(yīng)的產(chǎn)品,如訊飛聽見、訊飛錄音寶等,是不能支持長時(shí)間錄音、并且免費(fèi)轉(zhuǎn)寫的。而搜狗是首次做了長時(shí)錄音設(shè)置,并且支持免費(fèi)轉(zhuǎn)寫。
第二,搜狗的產(chǎn)品是面向垂直場景,包括記者采訪的場景、作家寫作的場景等等。這些功能雖小,但它體現(xiàn)在具體場景下,怎么絞盡腦汁的想盡辦法,幫朋友解決問題。
第三,功能上,訊飛手機(jī)端沒有”聽見“。且搜狗聽寫有語音實(shí)時(shí)轉(zhuǎn)文字、邊聽邊改、標(biāo)重點(diǎn)、快速查找、多端同步、不限時(shí)長錄音等功能。
除此之外,依托搜狗產(chǎn)品日均超過2.6億次的語音請求,提供海量的真實(shí)語料數(shù)據(jù),可以使得機(jī)器不斷學(xué)習(xí)并提升語音識別準(zhǔn)確率。
但對于搜狗轉(zhuǎn)寫免費(fèi)會(huì)持續(xù)多長時(shí)間這個(gè)問題,王硯峰表示,目前肯定是免費(fèi)的,至于之后會(huì)不會(huì)收費(fèi),并不完全確定。至少按照現(xiàn)有的產(chǎn)品形態(tài),肯定是在相當(dāng)長的時(shí)間內(nèi)不考慮使用這個(gè)產(chǎn)品來賺錢。作為一家互聯(lián)網(wǎng)公司,通過技術(shù)來收取技術(shù)服務(wù)費(fèi)不是搜狗的商業(yè)邏輯。至少到現(xiàn)在為止,搜狗還不想通過產(chǎn)品收費(fèi)的方式來進(jìn)行商業(yè)的變現(xiàn)。
為什么選擇這個(gè)時(shí)間點(diǎn)來發(fā)布產(chǎn)品?
王硯峰對雷鋒網(wǎng)表示,一方面,是與去年發(fā)布的知音引擎更好地呼應(yīng),另一方面,搜狗下半年將會(huì)集中發(fā)布一批人工智能落地產(chǎn)品。王硯峰坦言,客觀來講,搜狗作為一家人工智能業(yè)界公司,在AI落地方面做得遠(yuǎn)遠(yuǎn)不夠。也正因此,下半年將在硬件、軟件等場景集中一波攻勢,包括智能副駕、智能聽寫等。
基于搜狗的語音能力和自然交互能力,在非巨頭壟斷的行業(yè),搜狗將嘗試做更多硬件產(chǎn)品的自研、試水、投資,可能自己研發(fā),也可能投資一些公司,以合作的方式把這些產(chǎn)品做出來。
在王硯峰看來,不論是車載市場、家庭場景,還是可穿戴市場,雖然玩家很多,但離市場成熟期還早得很,在這個(gè)過程中,王硯峰認(rèn)為搜狗完全有信心拿出更多爆款產(chǎn)品或有量產(chǎn)品,來搶占市場份額,例如在中國可穿戴設(shè)備硬件中排名前五名的糖貓兒童手表,目前出貨量已突破100萬。
而已如今大火的Amazon Echo為例,王硯峰認(rèn)為,亞馬遜并非單獨(dú)將這個(gè)平臺推起來的,而是因?yàn)橛辛司薮蟮挠脩袅?、進(jìn)而帶動(dòng)了平臺的使用量,這才有了更多的開發(fā)者加入進(jìn)來。
在Amazon Echo上,雖然有很多的開發(fā)者,但其主功能的比例,絕大部分還是在定位在鬧鐘、天氣,以及音樂上。目前的中小開發(fā)者對于智能語音入口的產(chǎn)業(yè)格局尚且不成有力威脅,牌還是在巨頭的手上。
王硯峰對雷鋒網(wǎng)表示,如果智能語音入口級硬件可以自己做,像Amazon Echo那樣做出爆款產(chǎn)品,推出自己的硬件,進(jìn)而搶奪市場入口,這當(dāng)然是首選。但在手機(jī)和電視領(lǐng)域,搜狗暫不會(huì)做這樣的硬件,也不可能把硬件戰(zhàn)線拉得過長。對于搜狗來講,做十幾款硬件也是存在問題的。更適合的做法是——瞄準(zhǔn)幾款最有用戶痛點(diǎn)、最適合自己風(fēng)格的硬件產(chǎn)品來做。這兩個(gè)之間并不存在非此即彼的關(guān)系,更多的是互補(bǔ)的關(guān)系。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。