0
本文作者: camel | 2018-02-01 17:05 |
雷鋒網(wǎng)近日了解到——
哈爾濱工業(yè)大學(xué)劉挺教授 [1] 出任「云孚科技」首席科學(xué)家,其所帶領(lǐng)的哈爾濱工業(yè)大學(xué)社會(huì)計(jì)算與信息檢索研究中心(HIT-SCIR) 已入股云孚科技,而 HIT-SCIR 的科研成果將主要通過(guò)云孚科技進(jìn)行轉(zhuǎn)化。
云孚科技為一家地處北京中關(guān)村的初創(chuàng)公司,由85后CEO張文斌 [2] 創(chuàng)立于2017年8月1日。繼劉挺教授擔(dān)任首席科學(xué)家及 HIT-SCIR [3] 入股后,云孚科技 [4] 將成為國(guó)內(nèi)又一家有高校實(shí)驗(yàn)室深度參與的人工智能創(chuàng)業(yè)公司。
就此消息,我們向劉挺教授求得確認(rèn)。劉挺教授向雷鋒網(wǎng)介紹說(shuō),這件事情其實(shí)早在2017年10月就已經(jīng)開(kāi)始了,只是由于股權(quán)工商變更手續(xù)問(wèn)題,所以一直沒(méi)有對(duì)外界公布。
云孚科技,作為一家初創(chuàng)公司,剛剛成立半年時(shí)間,是什么使得在NLP領(lǐng)域鼎鼎大名的劉挺教授加盟并擔(dān)任其首席科學(xué)家呢?哈工大SCIR與云孚科技今后將是什么關(guān)系?SCIR為什么要將其科研成果主要通過(guò)云孚科技進(jìn)行轉(zhuǎn)化?云孚科技是否會(huì)成為中國(guó)科技行業(yè)的下一只獨(dú)角獸?……
帶著這一系列的問(wèn)題,雷鋒網(wǎng)很榮幸采訪到了劉挺教授以及云孚科技CEO 張文斌先生。
(左:云孚科技CEO 張文斌;右:哈工大劉挺教授)
[1] 劉挺,云孚科技首席科學(xué)家,哈爾濱工業(yè)大學(xué)教授,計(jì)算機(jī)學(xué)院社會(huì)計(jì)算與信息檢索研究中心主任;哈工大人工智能與中文信息處理方向帶頭人,主要研究方向?yàn)樽匀徽Z(yǔ)言處理和社會(huì)計(jì)算;國(guó)家“萬(wàn)人計(jì)劃”科技創(chuàng)新領(lǐng)軍人才;中國(guó)計(jì)算機(jī)學(xué)會(huì)理事、中國(guó)中文信息學(xué)會(huì)常務(wù)理事,多次擔(dān)任國(guó)家863重點(diǎn)項(xiàng)目總體組專(zhuān)家、基金委會(huì)評(píng)專(zhuān)家;主持研制“語(yǔ)言技術(shù)平臺(tái)LTP”、“大詞林”等,被業(yè)界廣泛使用;曾獲國(guó)家科技進(jìn)步二等獎(jiǎng)、省科技進(jìn)步一等獎(jiǎng)、錢(qián)偉長(zhǎng)中文信息處理科學(xué)技術(shù)一等獎(jiǎng)等;2012-2017年NLP頂級(jí)會(huì)議論文數(shù),世界排名第8(據(jù)劍橋大學(xué)統(tǒng)計(jì))。
[2] 張文斌,云孚科技創(chuàng)始人&CEO,哈爾濱工業(yè)大學(xué)計(jì)算機(jī)專(zhuān)業(yè)本科和碩士畢業(yè);2011年至2014年,擔(dān)任騰訊研發(fā)工程師,參與研發(fā)了搜索廣告平臺(tái)、分布式深度學(xué)習(xí)框架、微信語(yǔ)義開(kāi)放平臺(tái)、微信公眾號(hào)搜索等系統(tǒng);隨后從2014年6月到2017年7月,擔(dān)任本邦科技CTO,3年時(shí)間幫助公司的人員和營(yíng)收均增長(zhǎng)10倍。2017年8月創(chuàng)立云孚科技并擔(dān)任CEO。
[3] 哈工大社會(huì)計(jì)算與信息檢索研究中心 (HIT-SCIR) 成立于2000年9月1日,隸屬于計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院。SCIR 有教師9人,包括劉挺、秦兵、車(chē)萬(wàn)翔等知名教授。其研究方向包括語(yǔ)言分析、人機(jī)對(duì)話、閱讀理解、知識(shí)圖譜、自動(dòng)寫(xiě)作、情感分析和股票預(yù)測(cè)等方面。
已完成或正在承擔(dān)的國(guó)家973課題、國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目、國(guó)家863重點(diǎn)項(xiàng)目等重要課題20余項(xiàng)。近年來(lái) HIT-SCIR 在ACL、SIGIR、IJCAI、EMNLP等頂級(jí)國(guó)際學(xué)術(shù)會(huì)議上發(fā)表60余篇論文,積極參與國(guó)內(nèi)外技術(shù)評(píng)測(cè),并取得優(yōu)異成績(jī)。研究成果“語(yǔ)言技術(shù)平臺(tái)”獲黑龍江省科技進(jìn)步一等獎(jiǎng)。
目前 HIT-SCIR 有20名余博士生,30余名碩士生,學(xué)生中曾有3人獲百度獎(jiǎng)學(xué)金,3人獲微軟學(xué)者獎(jiǎng)學(xué)金等各類(lèi)獎(jiǎng)勵(lì)。已畢業(yè)博士20余人,碩士畢業(yè)生120余人,主要分布在高等院校和大型互聯(lián)網(wǎng)企業(yè)/人工智能企業(yè)中的研發(fā)部門(mén),還有創(chuàng)業(yè)者20余人。
[4] 云孚科技(北京)有限公司致力成為全球領(lǐng)先的中文語(yǔ)義技術(shù)服務(wù)商,核心產(chǎn)品包括NLP工具包、知識(shí)圖譜、輿情分析、對(duì)話系統(tǒng)、文本挖掘系統(tǒng)等,致力于以頂尖的語(yǔ)義技術(shù)助力企業(yè)智能升級(jí)。
創(chuàng)始人兼CEO張文斌先生是連續(xù)創(chuàng)業(yè)者,曾任騰訊微信AI研發(fā)、本邦科技CTO。
首席科學(xué)家劉挺教授是哈工大人工智能與中文信息處理方向帶頭人、中國(guó)計(jì)算機(jī)學(xué)會(huì)理事、中國(guó)中文信息學(xué)會(huì)常務(wù)理事,入選國(guó)家“萬(wàn)人計(jì)劃”科技創(chuàng)新領(lǐng)軍人才。
核心成員均來(lái)自BAT等頂尖互聯(lián)網(wǎng)公司,畢業(yè)于哈工大、北大、北郵、IIT等知名高校。
公司已入選騰訊、百度、滴滴的技術(shù)供應(yīng)商。
下面為雷鋒網(wǎng)根據(jù)采訪內(nèi)容整理而成,在不改變?cè)獾那闆r下略有改動(dòng)。
雷鋒網(wǎng):劉老師能否介紹一下HIT-SCIR這么多年的技術(shù)積累,目前有哪些最新的重要研究成果?這些成果在研究和應(yīng)用中有哪些意義?
劉挺:從1979年開(kāi)展俄漢題錄翻譯算起,哈工大在中文信息處理方面已經(jīng)做了近40年的研究。哈工大社會(huì)計(jì)算與信息檢索研究中心創(chuàng)建于2000年9月1日,我們的研究方向是自然語(yǔ)言處理與社會(huì)計(jì)算,我們的目標(biāo)是:“理解語(yǔ)言,認(rèn)知社會(huì)”。
(HIT-SCIR實(shí)驗(yàn)室標(biāo)語(yǔ))
我們一直秉承頂天立地的原則,在國(guó)家科技項(xiàng)目的支持下,在與互聯(lián)網(wǎng)/IT企業(yè)的長(zhǎng)期密切合作中,逐步打造出一批核心技術(shù),主要包括:
(1) 語(yǔ)言技術(shù)平臺(tái)平臺(tái)(LTP):如今多家大企業(yè)推出自己的自然語(yǔ)言處理基礎(chǔ)開(kāi)放平臺(tái),而哈工大是從2003年啟動(dòng)這項(xiàng)工作的,2006年開(kāi)始對(duì)外共享。LTP集成了6項(xiàng)中文處理基礎(chǔ)技術(shù),其中最重要的是依存句法分析和語(yǔ)義依存分析技術(shù)。句法分析技術(shù)在2009年獲得國(guó)際評(píng)測(cè)世界第1名,2017年獲得世界第4名、亞洲第1名(面向49種語(yǔ)言,113家隊(duì)伍參賽)。在過(guò)去的8年中,百度、騰訊、華為、訊飛等一批大企業(yè)先后購(gòu)買(mǎi)了LTP的使用權(quán)。LTP獲得2010年錢(qián)偉長(zhǎng)科學(xué)技術(shù)獎(jiǎng),2016年黑龍江省科技進(jìn)步獎(jiǎng)。
(2)大詞林(BigCilin):2014年,我們?cè)谝酝兄频摹锻x詞詞林(擴(kuò)展版)》的基礎(chǔ)上,采用最新的關(guān)系抽取技術(shù),動(dòng)態(tài)地自動(dòng)構(gòu)建海量中文詞語(yǔ)之間上下位關(guān)系、同義關(guān)系,目前大詞林的詞條超過(guò)千萬(wàn),而且還在不斷地?cái)U(kuò)充,是一個(gè)大規(guī)模的中文語(yǔ)言知識(shí)圖譜。在過(guò)去的4年中,阿里、騰訊、訊飛、搜狗等企業(yè)先后購(gòu)買(mǎi)了大詞林的使用權(quán)。
其他重要成果包括:
(1)中文人機(jī)對(duì)話技術(shù),涵蓋任務(wù)型對(duì)話、知識(shí)型問(wèn)答、閑聊和對(duì)話中的推薦技術(shù)等四個(gè)方面。我們?cè)?016年推出了“笨笨”聊天機(jī)器人,并在SMP2017會(huì)議上,在華為公司的贊助下與訊飛公司聯(lián)合組織了首屆中文人機(jī)對(duì)話評(píng)測(cè)。
(2)文本情感分析技術(shù),包括產(chǎn)品評(píng)論傾向性分析和情緒分析。
(3)基于社會(huì)媒體的預(yù)測(cè)技術(shù),包括電影票房預(yù)測(cè)和股票漲跌預(yù)測(cè)。
(4)自動(dòng)寫(xiě)作,當(dāng)前的研究重點(diǎn)是議論文自動(dòng)寫(xiě)作。
(笨笨聊天機(jī)器人,微信公眾號(hào):benbenrobot)
語(yǔ)言技術(shù)平臺(tái)是中文信息處理的基礎(chǔ)工具平臺(tái),大詞林是基礎(chǔ)語(yǔ)言知識(shí)平臺(tái),這兩項(xiàng)成果偏基礎(chǔ),其他四項(xiàng)成果偏應(yīng)用。人機(jī)對(duì)話是當(dāng)前研究熱點(diǎn),其重要意義無(wú)須贅述。在社交媒體上廣大網(wǎng)民發(fā)表大量的觀點(diǎn)、評(píng)論,釋放出海量的情緒,如果準(zhǔn)確地識(shí)別這些主觀信息,對(duì)于商家改進(jìn)自己的產(chǎn)品,政府掌握和引導(dǎo)輿情,都具有十分重要的意義。我們認(rèn)為大數(shù)據(jù)最關(guān)鍵的用途是預(yù)測(cè),只有準(zhǔn)確的預(yù)測(cè)才能輔助做出正確的決策,因此我們從2011年開(kāi)始做基于社交媒體的預(yù)測(cè)技術(shù)研究,未來(lái)也會(huì)長(zhǎng)期堅(jiān)持這個(gè)方向。自動(dòng)寫(xiě)作可以大幅度減輕以記者為代表的寫(xiě)作負(fù)荷,且機(jī)器比人更能夠及時(shí)、全面地捕捉熱點(diǎn)話題,并以不同字?jǐn)?shù)、不同風(fēng)格的文本呈現(xiàn)給讀者,這方面的研究越來(lái)越引起人們的重視。
雷鋒網(wǎng):SCIR 在過(guò)去很多年中已經(jīng)與國(guó)內(nèi)外許多知名企業(yè)有了很深入的合作。那么這次哈工大SCIR與云孚科技合作的動(dòng)因是什么?
劉挺:哈工大SCIR研究中心始終堅(jiān)持產(chǎn)學(xué)研的科研原則,18年來(lái)我們持續(xù)與若干大企業(yè)開(kāi)展合作,通過(guò)這些合作了解企業(yè)的真實(shí)需求,并將企業(yè)需求與國(guó)際學(xué)術(shù)前沿動(dòng)態(tài)相結(jié)合確定我們的科研選題,又通過(guò)將科研成果嵌入企業(yè)的產(chǎn)品中實(shí)現(xiàn)成果的應(yīng)用落地,并且在此過(guò)程中培養(yǎng)了研究生的實(shí)踐能力和市場(chǎng)意識(shí)。未來(lái),我們?nèi)匀粫?huì)堅(jiān)持產(chǎn)學(xué)研結(jié)合的原則,不斷加強(qiáng)與大企業(yè)的合作。
在2015年以前,與我們合作的企業(yè)都是互聯(lián)網(wǎng)和IT領(lǐng)域的大企業(yè),他們具備很強(qiáng)的技術(shù)研發(fā)能力,只不過(guò)在自然語(yǔ)言處理技術(shù)的某些方面不如我們積累的時(shí)間長(zhǎng),所以需要我們的幫助。在合作中,彼此很容易相互理解,企業(yè)里的研發(fā)人員能夠有效地提煉他們的問(wèn)題,并消化吸收我們提供的核心技術(shù)。
但2016年以后,由于人工智能不斷升溫,引起了國(guó)內(nèi)各行各業(yè)對(duì)自然語(yǔ)言處理技術(shù)的關(guān)注。來(lái)電或登門(mén)來(lái)尋求技術(shù)支持的公司來(lái)自銀行、證券公司、航空公司、電網(wǎng)/熱網(wǎng)、司法部門(mén)等等,這些行業(yè)的領(lǐng)導(dǎo)都意識(shí)到了人工智能的重要性,但往往對(duì)于人工智能在其所在行業(yè)里到底能夠做什么,做到什么程度還沒(méi)有非常清晰的認(rèn)識(shí),因此需要我們首先幫助他們做咨詢工作,同時(shí),這些行業(yè)里缺乏足夠的人工智能技術(shù)人才,這使得我們的技術(shù)向他們轉(zhuǎn)移遇到困難。由于我們研究中心作為教學(xué)科研單位,無(wú)法完成面向各行各業(yè)的咨詢、培訓(xùn)和開(kāi)發(fā)任務(wù),所以,這兩年我們委婉地回絕了來(lái)自各行各業(yè)的大量技術(shù)合作請(qǐng)求,這些企業(yè)感到失望,我們一方面感到抱歉,另一方面也為自己的技術(shù)不能順利地變成生產(chǎn)力去支持這些企業(yè)的發(fā)展感到遺憾。
我們要想能夠?yàn)檫@些非IT企業(yè)服務(wù),就需要在我們與這些企業(yè)之間有一個(gè)愿意密切配合我們的人工智能類(lèi)研發(fā)型企業(yè)。這個(gè)企業(yè)負(fù)責(zé)為客戶提供咨詢、培訓(xùn)服務(wù),更重要的是把我們的核心技術(shù)面向各個(gè)行業(yè)的需求開(kāi)發(fā)成產(chǎn)品和服務(wù)。只有這樣,才能克服這兩年我們的遇到的前所未有的技術(shù)需求過(guò)剩,而技術(shù)轉(zhuǎn)化能力不足的問(wèn)題。
在上述背景下,這兩年我們一直在尋找一家初創(chuàng)公司來(lái)開(kāi)展一種與以往不同的合作,我們掌握的幾乎全部自主產(chǎn)權(quán)的技術(shù)都將通過(guò)這個(gè)公司向外輸出,而這個(gè)企業(yè)也需要集中精力去做我們期望的成果轉(zhuǎn)化。大企業(yè)或者已經(jīng)有自己明確而穩(wěn)定的業(yè)務(wù)方向的中小企業(yè)都不太可能配合我們?nèi)ネ瓿蛇@個(gè)使命,而人工智能領(lǐng)域中的初創(chuàng)公司是我們重點(diǎn)尋找的對(duì)象。
云孚科技的創(chuàng)始人兼CEO張文斌先生是我實(shí)驗(yàn)室的碩士畢業(yè)生,他畢業(yè)后先在騰訊工作3年,又作為CTO創(chuàng)業(yè)3年并取得成功,2017年8月他創(chuàng)立云孚科技,有志于在人工智能領(lǐng)域做出一番事業(yè),因此我們一拍即合,云孚正是我們這兩年一直在尋找的密切合作伙伴,哈工大SCIR研究中心也成為了云孚的技術(shù)合伙人,持有云孚30%的股權(quán)。這一決定得到了哈工大校方的支持,哈工大資產(chǎn)公司代表校方在云孚科技間接持股,也就是說(shuō),哈工大SCIR與云孚科技不只是“合作關(guān)系”,而是“合伙關(guān)系”。
雷鋒網(wǎng):國(guó)內(nèi)優(yōu)秀的初創(chuàng)公司有很多,是什么吸引了劉老師選擇并加入云孚科技?
劉挺:師生之間有天然的信任關(guān)系,校友與實(shí)驗(yàn)室之間在文化上同宗同源,這是我選擇入股云孚公司,并愿意擔(dān)任首席科學(xué)家的重要原因。
同時(shí),張文斌在校期間就很突出,獲得過(guò)哈爾濱工業(yè)大學(xué)優(yōu)秀畢業(yè)生、特等獎(jiǎng)學(xué)金、國(guó)家獎(jiǎng)學(xué)金、ACM國(guó)際大學(xué)生程序設(shè)計(jì)競(jìng)賽亞洲區(qū)域賽銀獎(jiǎng)等獎(jiǎng)勵(lì),曾任哈工大校ACM技術(shù)俱樂(lè)部負(fù)責(zé)人,他的綜合素質(zhì)非常高,各方面能力優(yōu)異而均衡。創(chuàng)業(yè)者需要有強(qiáng)大的心理和身體條件,文斌精力過(guò)人,他在校期間是校學(xué)生會(huì)體育部副部長(zhǎng),也是籃球場(chǎng)上、足球場(chǎng)上的風(fēng)云人物。
(云孚科技CEO,張文斌)
他畢業(yè)后先在騰訊工作了三年,包括搜搜、微信等部門(mén),積累了大企業(yè)工作經(jīng)驗(yàn)。然后他出任北京本邦科技CTO創(chuàng)業(yè)三年,協(xié)助他的師兄CEO劉桂平以“技術(shù)驅(qū)動(dòng)營(yíng)銷(xiāo)”為使命,把本邦做得風(fēng)生水起。既有互聯(lián)網(wǎng)大企業(yè)工作經(jīng)驗(yàn),又有成功地參與創(chuàng)業(yè)的經(jīng)驗(yàn),這樣的人是非常適合獨(dú)立創(chuàng)業(yè)的。文斌1987年出生,剛過(guò)而立之年,正是精力充沛的年齡。他在性格上既有主見(jiàn)又從善如流,在工作風(fēng)格上既有大志又腳踏實(shí)地,執(zhí)行力極強(qiáng)。我和哈工大SCIR研究中心能夠找到文斌這樣的創(chuàng)業(yè)者一起合作,是不容易的事情,需要機(jī)緣,我很珍惜這樣的機(jī)緣。
我雖然是文斌的老師,但云孚科技是以文斌為主導(dǎo)的創(chuàng)業(yè)公司,我只負(fù)責(zé)技術(shù)研發(fā),公司的產(chǎn)品開(kāi)發(fā)和商業(yè)運(yùn)營(yíng)完全按照文斌以及其他合伙人的規(guī)劃去實(shí)施。
云孚科技的創(chuàng)業(yè)團(tuán)隊(duì)既有資深的語(yǔ)義技術(shù)背景,又有創(chuàng)業(yè)成功的經(jīng)驗(yàn)和豐富的企業(yè)服務(wù)經(jīng)驗(yàn),同時(shí)執(zhí)行力強(qiáng)、接地氣,讓我很有信心可以把語(yǔ)義技術(shù)產(chǎn)品化、商業(yè)化這件事做成。
雷鋒網(wǎng):劉老師和張總這次創(chuàng)業(yè)是怎么牽手到一塊兒去的,能否介紹一下細(xì)節(jié)?
劉挺:文斌是我實(shí)驗(yàn)室的學(xué)生,他的技術(shù)能力出眾又有較高的綜合素質(zhì),所以我始終對(duì)他保持關(guān)注。
2017年8月份文斌作為CEO創(chuàng)立了云孚科技,定位做toB的業(yè)務(wù),為企業(yè)提供技術(shù)解決方案。他沒(méi)有拿投資,前期投入的都是自己的資金,但很快便組建起了一個(gè)小團(tuán)隊(duì)并實(shí)現(xiàn)了正向現(xiàn)金流,并與騰訊、百度、滴滴等知名企業(yè)達(dá)成了合作。他的膽識(shí)魄力、商業(yè)運(yùn)作、團(tuán)隊(duì)管理、創(chuàng)業(yè)經(jīng)驗(yàn)上的表現(xiàn)都得到了我的高度認(rèn)可。
我實(shí)驗(yàn)室積累了很多NLP的技術(shù),需要一家創(chuàng)業(yè)公司把它們真正產(chǎn)品化,以服務(wù)更多的企業(yè),最大化這些技術(shù)的價(jià)值。而文斌也在積極探索把企業(yè)做大做強(qiáng)的路徑。
張文斌:我雖然畢業(yè)6年了,但我跟實(shí)驗(yàn)室的很多畢業(yè)生一樣都跟實(shí)驗(yàn)室保持著密切的聯(lián)系,關(guān)注著實(shí)驗(yàn)室的發(fā)展,也經(jīng)常在北京聚會(huì)見(jiàn)面。我對(duì)實(shí)驗(yàn)室在人才、技術(shù)、聲譽(yù)等方面的積累高度認(rèn)可,我認(rèn)為只靠商業(yè)模式創(chuàng)新的時(shí)代已經(jīng)過(guò)去了,技術(shù)在商業(yè)上的價(jià)值越來(lái)越高,我有意愿把母校的技術(shù)結(jié)合到自己的創(chuàng)業(yè)中,同時(shí)也為母校的科研成果產(chǎn)業(yè)化盡一點(diǎn)兒綿薄之力。
(張文斌與HIT-SCIR實(shí)驗(yàn)室研究人員,其中有劉挺、秦兵、車(chē)萬(wàn)翔等知名學(xué)者)
2017年十一長(zhǎng)假,劉老師和我都沒(méi)有休假,開(kāi)始商討合作事宜,在北京連續(xù)見(jiàn)面4次,迅速敲定各項(xiàng)合作事宜。在過(guò)去的四個(gè)月里,已經(jīng)實(shí)際推進(jìn)了多項(xiàng)技術(shù)的研發(fā),最近股權(quán)工商變更手續(xù)完成,才正式向外界公布這一消息。
雷鋒網(wǎng):云孚的官網(wǎng)上寫(xiě)云孚科技是一家「中文語(yǔ)義技術(shù)服務(wù)商」。它跟市面上其它語(yǔ)義供應(yīng)商(例如小i,出門(mén)問(wèn)問(wèn))相比,側(cè)重點(diǎn)哪里不一樣?
張文斌:云孚科技依托HIT-SCIR在NLP領(lǐng)域18年的技術(shù)積累,幾乎覆蓋了NLP全棧的技術(shù),無(wú)論在語(yǔ)義技術(shù)的深度還是廣度上,一般創(chuàng)業(yè)公司都很難匹敵。基于深厚的語(yǔ)義技術(shù)積累,云孚科技可以為合作伙伴提供更為優(yōu)異的解決方案。
云孚科技目前專(zhuān)注于做底層的語(yǔ)義技術(shù)服務(wù)商,希望發(fā)揮好自己的長(zhǎng)處,為企業(yè)客戶提供語(yǔ)義動(dòng)力引擎。小i主要做智能客服的業(yè)務(wù),出門(mén)問(wèn)問(wèn)則專(zhuān)注to C的智能軟硬件產(chǎn)品。云孚科技與這些公司在產(chǎn)品和定位上均存在較大差異。
雷鋒網(wǎng):請(qǐng)問(wèn)張總,云孚科技的核心愿景是什么呢?能否詳細(xì)解釋一下?
張文斌:云孚科技的愿景是成為全球領(lǐng)先的語(yǔ)義技術(shù)服務(wù)商,基于頂尖的語(yǔ)義技術(shù)為各行業(yè)打造智能行業(yè)解決方案,助力企業(yè)在人工智能時(shí)代實(shí)現(xiàn)智能升級(jí)。
自然語(yǔ)言處理是人工智能皇冠上的明珠,微軟執(zhí)行副總裁沈向洋博士在2017年中國(guó)計(jì)算機(jī)大會(huì)上講:懂語(yǔ)言者得天下。在人工智能從感知智能向認(rèn)知智能發(fā)展的過(guò)程中,自然語(yǔ)言處理必將得到企業(yè)界和學(xué)術(shù)界更多的關(guān)注。語(yǔ)義技術(shù)是當(dāng)前自然語(yǔ)言處理技術(shù)最重要的突破口,也是支撐各行業(yè)自然語(yǔ)言處理應(yīng)用的關(guān)鍵。云孚科技以語(yǔ)義技術(shù)為核心技術(shù),面向行業(yè)提供智能解決方案,這是我們公司的基本定位。語(yǔ)義技術(shù)服務(wù)商將幫助企業(yè)提升內(nèi)部信息、數(shù)據(jù)的挖掘深度和加工效率,以及從外界獲取信息和發(fā)布信息的能力。
語(yǔ)義技術(shù)是中文信息處理領(lǐng)域的關(guān)鍵技術(shù)。中文信息處理經(jīng)歷了幾個(gè)階段,從輸入輸出(激光照排、拼音輸入、漢字識(shí)別、語(yǔ)音合成、語(yǔ)音識(shí)別),到內(nèi)容處理(文本檢索、機(jī)器翻譯),再到互聯(lián)網(wǎng)時(shí)代的搜索引擎。在每個(gè)階段,中國(guó)的企業(yè)家和學(xué)者都通過(guò)艱苦的努力把中文技術(shù)做到了世界領(lǐng)先,用國(guó)人自己研發(fā)的產(chǎn)品占領(lǐng)了中文市場(chǎng),前輩的成就是非常令人驕傲,令人欽佩的。如今,語(yǔ)義處理的時(shí)代已經(jīng)來(lái)臨,語(yǔ)義技術(shù)在于市場(chǎng)結(jié)合的過(guò)程中逐步走向成熟,在這個(gè)技術(shù)階段,一定會(huì)涌現(xiàn)出一批優(yōu)秀的企業(yè),在這個(gè)時(shí)代擔(dān)負(fù)歷史責(zé)任,使中國(guó)在語(yǔ)義處理方面不但不落后于英文,甚至能夠反超。云孚科技愿意成為這樣的擁有強(qiáng)大核心技術(shù)、敏銳的市場(chǎng)洞察力和歷史使命感的企業(yè),順應(yīng)潮流,有所作為,做出應(yīng)有的貢獻(xiàn)。
雷鋒網(wǎng):目前國(guó)內(nèi)有許多人工智能相關(guān)的公司,請(qǐng)問(wèn)云孚科技的競(jìng)爭(zhēng)優(yōu)勢(shì)是什么?
劉挺:作為云孚的技術(shù)合伙人,HIT-SCIR既有的技術(shù)實(shí)力、技術(shù)聲譽(yù)將為云孚提供有力的支撐,尤其是在云孚的起步階段。
張文斌:云孚是初創(chuàng)公司,但又不是單純地通過(guò)商業(yè)模式創(chuàng)新,而是在有著近18年技術(shù)積淀的實(shí)驗(yàn)室為依托的創(chuàng)業(yè)公司。地處北京中關(guān)村的85后企鵝系人工智能創(chuàng)業(yè)概念 和 地處邊陲的中國(guó)著名工科大學(xué)深厚技術(shù)積累的釋放、轉(zhuǎn)化,這兩個(gè)要素將在云孚有機(jī)地整合在一起,從而迸發(fā)出足夠的勢(shì)能、動(dòng)能,這將構(gòu)成云孚的核心競(jìng)爭(zhēng)力。
與其他眾多優(yōu)秀的人工智能創(chuàng)業(yè)企業(yè)不同,云孚科技愿意與投資界保持溝通,建立聯(lián)系,但暫不融資。在過(guò)去的幾個(gè)月里,云孚快速實(shí)現(xiàn)了自身造血,并不斷擴(kuò)大盈利規(guī)模。我們希望完全按照我們的規(guī)劃和意愿,不受資本市場(chǎng)影響,先扎扎實(shí)實(shí)地做一段時(shí)間,以后在合適的時(shí)機(jī)再融資。所以,接地氣的自身造血能力,是云孚的核心競(jìng)爭(zhēng)力之一,不走炒作概念燒錢(qián)的路線,但同時(shí)不拒絕在真需要錢(qián)的時(shí)候獲得資本市場(chǎng)的支持。
劉挺: 有不少投資人與我聯(lián)系,我的響應(yīng)不夠積極,背后就是文斌說(shuō)的這個(gè)原因。不過(guò),我們還是非常樂(lè)于與投資界接觸,慢慢尋找真正志同道合的投資人。
雷鋒網(wǎng):HIT-SCIR與云孚科技今后將如何合作?能否詳細(xì)說(shuō)明下。
張文斌:HIT-SCIR身處學(xué)校,繼續(xù)負(fù)責(zé)前沿語(yǔ)義技術(shù)的探索,云孚科技負(fù)責(zé)語(yǔ)義技術(shù)的產(chǎn)品化、商業(yè)化以及在垂直領(lǐng)域的深度定制和優(yōu)化,雙方將合力打造出一系列好用的高水準(zhǔn)的語(yǔ)義技術(shù)產(chǎn)品,幫助企業(yè)實(shí)現(xiàn)智能升級(jí)。
劉挺:從去年十一至今的四個(gè)月中,云孚科技已經(jīng)與HIT-SCIR聯(lián)手對(duì)語(yǔ)言技術(shù)平臺(tái)(LTP)和大詞林等基礎(chǔ)技術(shù)和資源平臺(tái)進(jìn)行了工程化二次開(kāi)發(fā)。哈工大語(yǔ)言技術(shù)平臺(tái)每天接受來(lái)自網(wǎng)絡(luò)用戶的使用請(qǐng)求70余萬(wàn)次,要保證云服務(wù)的穩(wěn)定,以便支撐中小企業(yè)商業(yè)用途的需要,需要云孚利用其工程開(kāi)發(fā)的優(yōu)勢(shì)提高LTP的運(yùn)行效率和穩(wěn)定性。
除了一些只希望與高校合作,并希望得到哈工大基礎(chǔ)研究成果的大企業(yè)外,來(lái)自中小互聯(lián)網(wǎng)/IT企業(yè)的需求,尤其是對(duì)于產(chǎn)品和整體解決方案的需求,都由云孚科技響應(yīng),HIT-SCIR只提供核心技術(shù)。
雷鋒網(wǎng):張總能否介紹一下目前云孚科技在產(chǎn)品、技術(shù)、人才和資金等方面的現(xiàn)狀?
張文斌:云孚科技目前主要積累了NLP工具包、知識(shí)圖譜、輿情分析、對(duì)話系統(tǒng)、文本挖掘系統(tǒng)等語(yǔ)義技術(shù)產(chǎn)品。
(云孚目前的產(chǎn)品,圖片來(lái)源于云孚官網(wǎng))
公司于2017年8月1日成立,現(xiàn)有15人,80%為研發(fā)人員,核心成員均畢業(yè)于哈工大、北大、北郵、北科大、美國(guó)伊利諾伊理工大學(xué)等知名學(xué)府。雖然公司有哈工大SCIR研究中心的大力支持,但仍然需要更多優(yōu)秀人才全職加盟,有意共同發(fā)展的同仁可以直接聯(lián)系我。
公司的啟動(dòng)資金由我個(gè)人投入。公司目前已經(jīng)簽約數(shù)百萬(wàn)訂單并實(shí)現(xiàn)正向現(xiàn)金流,所以并不急于融資。
雷鋒網(wǎng):劉老師您如何看待云孚科技的未來(lái)前景?
劉挺:云孚科技目前還處于初創(chuàng)期,以語(yǔ)義技術(shù)為依托,正在與各行業(yè)的企業(yè)客戶廣泛接觸,同時(shí)以真實(shí)需求打磨自己的產(chǎn)品并探索大規(guī)模盈利的商業(yè)模式。戰(zhàn)略目標(biāo)清晰,又能夠扎實(shí)落地。我非常看好云孚科技的前景,它必將成長(zhǎng)為人工智能領(lǐng)域的獨(dú)角獸。
云孚未來(lái)會(huì)逐步聚焦到某些特定行業(yè)中,為企業(yè)提供服務(wù),也不排除在適當(dāng)時(shí)機(jī)研發(fā)行業(yè)內(nèi)通用產(chǎn)品,甚至是to C產(chǎn)品的可能性。
雷鋒網(wǎng):作為云孚科技的技術(shù)合伙人和首席科學(xué)家,您覺(jué)得語(yǔ)義技術(shù)服務(wù)這個(gè)領(lǐng)域的商業(yè)前景如何?
劉挺:人工智能時(shí)代已來(lái),許多企業(yè)存在大量語(yǔ)義分析(自然語(yǔ)言處理,NLP)的需求。但人工智能技術(shù)門(mén)檻較高,人才稀缺且成本很高,普通公司難以花費(fèi)高昂的金錢(qián)和時(shí)間成本組建自己的語(yǔ)義分析團(tuán)隊(duì),這就是語(yǔ)義技術(shù)服務(wù)的市場(chǎng)所在。語(yǔ)義技術(shù)服務(wù)商為企業(yè)提供知識(shí)圖譜、文本挖掘等各類(lèi)專(zhuān)業(yè)的語(yǔ)義技術(shù)服務(wù),免去企業(yè)自己構(gòu)建語(yǔ)義技術(shù)團(tuán)隊(duì)的高昂成本,幫助企業(yè)快速高效且低成本地解決各種語(yǔ)義分析的難題。
我們?cè)诳吹秸Z(yǔ)義技術(shù)服務(wù)領(lǐng)域迫切的商業(yè)需求和廣闊的應(yīng)用前景的同時(shí),也必須指出要在商業(yè)上取得成功,需要作出艱苦的努力,因?yàn)橥ㄓ玫恼Z(yǔ)義分析的作用有限,語(yǔ)義技術(shù)必須與行業(yè)結(jié)合,只有充分地獲取和利用行業(yè)知識(shí),充分地理解和融入行業(yè)中既有的業(yè)務(wù)模式,才能真正實(shí)現(xiàn)語(yǔ)義技術(shù)的落地,為行業(yè)創(chuàng)造新的價(jià)值,得到行業(yè)的認(rèn)可。沒(méi)有貨真價(jià)實(shí)的核心技術(shù),或者不愿意耐心細(xì)致地與行業(yè)結(jié)合,都無(wú)法取得商業(yè)上的成功。
雷鋒網(wǎng):此次合作,對(duì)于SCIR有什么重要的意義?
劉挺:我研究中心的研究方向是中文信息處理,這是一個(gè)應(yīng)用型很強(qiáng)的方向,因此我們一方面發(fā)表頂級(jí)會(huì)議論文,比如,劍橋大學(xué)統(tǒng)計(jì)了2012-2017年世界自然語(yǔ)言處理領(lǐng)域頂級(jí)會(huì)議上發(fā)表論文的數(shù)量,我代表我們實(shí)驗(yàn)室排在世界第8位,另一方面積極地通過(guò)與企業(yè)的合作轉(zhuǎn)化科研成果。
我本人在1995年和1998年兩次到北大,有幸與王選老師見(jiàn)面,得到他的指點(diǎn)。這兩次見(jiàn)面對(duì)我觸動(dòng)很大,我從那時(shí)起立志“以中文技術(shù),助民族復(fù)興”,而且一定走產(chǎn)學(xué)研結(jié)合,頂天立地的道路,換句話說(shuō),就是以王選老師為楷模,研發(fā)前沿的技術(shù),并轉(zhuǎn)化為產(chǎn)品,推動(dòng)中文信息行業(yè)的發(fā)展。
技術(shù)與市場(chǎng)的結(jié)合是艱難的,我研究中心曾研發(fā)出多個(gè)超前的產(chǎn)品原型,比如2010年前后研制出“個(gè)性化新聞推薦系統(tǒng)”,但并沒(méi)有能力推廣應(yīng)用。此次與云孚的合作,除了我上面談到的響應(yīng)各行各業(yè)關(guān)于自然語(yǔ)言處理的技術(shù)需求之外,也會(huì)通過(guò)對(duì)各類(lèi)用戶需求的觀察,凝煉新的產(chǎn)品概念,去實(shí)現(xiàn)以往沒(méi)有條件實(shí)現(xiàn)的一些規(guī)劃,一些夢(mèng)想。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。