7
昨天云知聲在京舉行了年度品牌發(fā)布會,除了宣布與華為進行合作這個儀式,大屏幕一直在播放其互聯(lián)網客戶這一年對云之聲的反饋,唱吧陳華、Ucloud季昕華、酷我音樂雷鳴、亮風臺廖春元、小優(yōu)劉雪楠、有巢智能皮振興、學多多符悅、爽哥英語Jason等我們熟悉的30多個創(chuàng)業(yè)者面孔,讓坐在下面的媒體朋友們以為來了個互聯(lián)網新銳CEO的一個大集結。
而云知聲CEO黃偉則重點回顧了自家在這一年取得了什么進展:
? 升級LSTM深度學習技術
? 語音方面,在IOT方面延生了 遠講識別和降噪技術、低功耗喚醒和識別技術、車載噪聲和回聲消除技術
? 語義方面,將解析領域擴充至60+
? 發(fā)布面向家居的完整解決方案
? 在車載終端后市場份額做到第一
? 在口語評測方向成立子公司
? 開始和華為、高通、海爾這些大公司取得合作。
會上,我們看到年初以開放、親近互聯(lián)網自居的云知聲開始更多地和大廠商合作,以及在智能硬件遭遇寒冬的情況下,依然逆勢推出面向IOT領域的完整解決方案,會后雷鋒網采訪了CEO黃偉,問他如此布局的原因。
黃偉:目前智能家居和車載,跟手機比的話,存量確實不大,但這是一個新興的市場,它未來的容量會超越互聯(lián)網,最近國內有很多芯片收購的案子其實都跟硬件聯(lián)網息息相關。
從行業(yè)布局的角度看,今天的量小,并不代表未來的量小,而且跟硬件相關的,越是看著很艱苦的工作,越是要提前做,就像今年的O2O,除了一線的BAT,有價值的恰恰是那些干過苦活臟活累活的58同城美團等,這也是在硬件還沒起來的時候,我們要去做IOT布局的考慮和原因。
另外,我想說的是,跟硬件相關的語音識別第一個考慮的是成本,之前亞馬遜icon音響有個9個麥克風,就像9個信息源一樣,可能要一個非常powerful的CPU放上算法把聲學噪音消除掉,但是光處理所有跟聲學相關的部件就要100美金以上,但廠商最多能承受10多美金的水準,所以要等以后做到3-4美金的成本,智能硬件才會更好地普及。
黃偉:其實是因為技術獲得認可后,我們被對方選擇的,和華為高通全志的合作,他們的行業(yè)標準制定者是有利于提升我們的技術水平的,他們的量非常大。
來的人我們既需要高通華為這樣的大客戶,也需要創(chuàng)新性的小客戶。
因為大客戶往往是穩(wěn)健保守的,創(chuàng)新性產品往往是創(chuàng)業(yè)公司來承擔,小的公司沒錢的時候,不會硬性說你先給我錢,對于一些好的團隊和好產品方向也會給與一些支持。
黃偉:每個公司有自己的基因和主業(yè),百度在08年之前就開始跟中科學合作,08年后就組建了自己的團隊,還請來了吳恩達博士;微信下面有自己專門的語音識別團隊;訊飛可能更多地關注政府、金融或者運營商。
作為一家創(chuàng)業(yè)公司,我們自己的定位是一家技術驅動的互聯(lián)網公司,我記得二零零幾年初的時候,這個領域的博士畢業(yè)生工作是不太好找的,甚至是要轉行的,但最近人工智能整個領域都在蠢蠢欲動:
這個領域技術積累很重要,但我們更相信技術到方案的快速落地比較重要,在提供的技術性能不變的情況下,保持高效率,低成本這可以說是我們作為一個創(chuàng)業(yè)公司近兩年快速突圍一直在努力的東西。
另外雖說競爭對手都很強大,但是公司再大,每個Team獲取的資源是相對有限的,隨著時間的推移,大家都各自會奔向各自要深耕的垂直領域。
除了云知聲,BAT、科大訊飛等廠家都普遍使用了DNN算法,對于云之聲升級的LSTM算法,
黃偉表示:
DNN是一個前向操作,對時間軸是沒有記憶的,但LSTM具有記憶能力,對時間軸可以進行建模,對大數(shù)據(jù)的描述和解析能力會更強。
(對此,記者問了思必馳CEO高始興對LSTM算法的看法—— “相對于DNN,可以學習長時和短時兩種上下文信息,本質是一種遞歸網絡,用的好的話,聲學可以提升相對15%(不是絕對提升),相應地計算量也會更大”,高始興如是說。)
相對于科大訊飛的十多年布局,云知聲成立之初一直以互聯(lián)網公司自居,借著親民形象俘獲了不少硬創(chuàng)公司的支持,在新興垂直領域,比如家居、車載取得了一定的成果,甚至在科大訊飛布局的在線教育也搶得了一杯羹,而從會上發(fā)布的合作商名單來看,其在大公司領域也開始窮追猛趕,但是目前語音識別公司間的競爭并不像外部想的那樣你死我活。
語音識別作為一項應用技術,而不是產品,在生活中的應用領域非常之多、非常之細,如果要問兩者間的區(qū)別
“科大更封閉一些,云之聲更開放”
科大訊飛的人士如此回應說。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。