考拉閱讀完成2000萬(wàn)美元B輪融資，用AI技術(shù)自研中文分級(jí)閱讀系統(tǒng)

本文作者：張莉

2018-08-10 10:04

導(dǎo)語(yǔ)：中文少兒分級(jí)閱讀平臺(tái)“考拉閱讀”宣布完成2000萬(wàn)美金B(yǎng)輪融資。

雷鋒網(wǎng)消息，近日，中文少兒分級(jí)閱讀平臺(tái)“考拉閱讀”宣布完成2000萬(wàn)美金B(yǎng)輪融資。此次融資由GGV紀(jì)源資本和XVC共同領(lǐng)投，CMC華人文化產(chǎn)業(yè)基金跟投，原有投資人啟明創(chuàng)投超額跟投。安可資本擔(dān)任本輪融資獨(dú)家財(cái)務(wù)顧問(wèn)。

此次融資將主要用于考拉閱讀原創(chuàng)“中文分級(jí)閱讀系統(tǒng)ER Framework”的優(yōu)化升級(jí)、優(yōu)質(zhì)閱讀內(nèi)容的生產(chǎn)聚合及市場(chǎng)規(guī)模的擴(kuò)大。

考拉閱讀完成2000萬(wàn)美元B輪融資，用AI技術(shù)自研中文分級(jí)閱讀系統(tǒng)

考拉閱讀創(chuàng)始人、CEO趙梓淳強(qiáng)調(diào)：“考拉閱讀完成本輪融資后，一方面將繼續(xù)加大在技術(shù)和研發(fā)上的投入，推進(jìn)與高校等研究機(jī)構(gòu)的進(jìn)一步合作；另一方面則會(huì)持續(xù)加大市場(chǎng)投入，開展中學(xué)市場(chǎng)的推進(jìn)，保持公司在中文分級(jí)閱讀領(lǐng)域的絕對(duì)領(lǐng)先優(yōu)勢(shì)?！?/p>

另外，據(jù)考拉閱讀透露，在近半年時(shí)間里，考拉閱讀的日活用戶增長(zhǎng)近百倍，全產(chǎn)品矩陣日活接近百萬(wàn)，目前學(xué)生端次日次周及次月留存均高達(dá)70%以上，平均日停留時(shí)長(zhǎng)約30分鐘。

考拉閱讀創(chuàng)立于2016年9月，據(jù)介紹，考拉閱讀是全球首家提出“中文少兒分級(jí)閱讀”概念的創(chuàng)業(yè)公司，依托自主研發(fā)，全球首創(chuàng)量化中文分級(jí)閱讀系統(tǒng) ER Framework，將中文文本按照難度進(jìn)行量化分級(jí)，并匹配學(xué)生不同的閱讀能力，進(jìn)而提供個(gè)性化的閱讀內(nèi)容及語(yǔ)文學(xué)習(xí)解決方案。

考拉閱讀完成2000萬(wàn)美元B輪融資，用AI技術(shù)自研中文分級(jí)閱讀系統(tǒng)

雷鋒網(wǎng)注：中文分級(jí)閱讀系統(tǒng) ER Framework

分級(jí)閱讀的關(guān)鍵難點(diǎn)之一是“如何科學(xué)劃分文本的難度等級(jí)”。不同于西方印歐語(yǔ)系繁復(fù)的格標(biāo)記語(yǔ)法系統(tǒng)，漢語(yǔ)語(yǔ)法過(guò)于靈活、意合語(yǔ)義相當(dāng)復(fù)雜等特點(diǎn)也讓分級(jí)閱讀的技術(shù)實(shí)現(xiàn)面臨嚴(yán)峻挑戰(zhàn)，要想完成規(guī)?；慕鉀Q方案只能依賴于現(xiàn)代科學(xué)技術(shù)的發(fā)展。

據(jù)介紹，考拉閱讀歷時(shí)兩年，構(gòu)建起全球最大的中文分級(jí)底層語(yǔ)料庫(kù)，結(jié)合語(yǔ)言學(xué)，測(cè)量心理學(xué)以及深度神經(jīng)網(wǎng)絡(luò)為代表的前沿AI算法解決了這一難題。

據(jù)考拉閱讀CTO任易介紹，考拉閱讀的中文分級(jí)閱讀標(biāo)準(zhǔn)（ER Framework ）借鑒了國(guó)外的“詞、句”的分析思想，基于ER Framework的分級(jí)閱讀標(biāo)準(zhǔn)在「詞」、「句」的基礎(chǔ)上再加入「字」、「段」、「篇」三個(gè)維度，即從「字詞句段篇」五大維度提取幾十個(gè)特征來(lái)表達(dá)中文的難度，并實(shí)現(xiàn)段落、主題等的分析。如在「字」其下還有常用性、構(gòu)形、組合性三個(gè)特征，「句」則有句法結(jié)構(gòu)、語(yǔ)義邏輯、修辭表達(dá)和嵌套深度四個(gè)特征等等。

“因?yàn)橹形牡牡木渥酉噍^英文要復(fù)雜得多，機(jī)器在理解中文的第一步就會(huì)遇到詞性分析、語(yǔ)言模型上的困難。所以，有賴于現(xiàn)在流行的AI技術(shù)，如RNN、LSTM等深度學(xué)習(xí)技術(shù)，可以彌補(bǔ)中文在NLP上的缺失?！比我妆硎?，“現(xiàn)在我們可以做到，將一個(gè)句子按照句法樹、依賴關(guān)聯(lián)等予以拆解，以分析每一個(gè)成分在句子中的比重，從而實(shí)現(xiàn)閱讀文本的難度分級(jí)?！?/p>

去年此時(shí)，考拉閱讀剛完成3000萬(wàn)的Pre-A輪融資。趙梓淳在接受雷鋒網(wǎng)專訪的時(shí)候表示，他們一共處理了幾百萬(wàn)字的非平衡語(yǔ)料庫(kù)和幾億字的平衡語(yǔ)料庫(kù)。

據(jù)悉，考拉閱讀相關(guān)技術(shù)和研究成果已申請(qǐng)多項(xiàng)專利和國(guó)家重大課題項(xiàng)目，并獲得北京大學(xué)、北京師范大學(xué)等權(quán)威機(jī)構(gòu)專家認(rèn)證，構(gòu)建了從工具到到內(nèi)容的完整閉環(huán)。

趙梓淳介紹，從技術(shù)方面來(lái)說(shuō)，考拉閱讀打造了一個(gè)頂尖的科學(xué)家團(tuán)隊(duì)，聯(lián)合創(chuàng)始人任易博士畢業(yè)于北京大學(xué)，主攻數(shù)據(jù)挖掘方向，曾在 IBM Waston for Life Service 和微軟亞洲研究院工作；首席數(shù)據(jù)科學(xué)家顧問(wèn)趙俊博博士曾在 Facebook 從事研究工作，師從于機(jī)器學(xué)習(xí)頂尖學(xué)者、深度學(xué)習(xí)的奠基人之一 Yann LeCun 教授；首席閱讀測(cè)評(píng)科學(xué)家魏久喬畢業(yè)于北京大學(xué)和新加坡國(guó)立大學(xué)應(yīng)用語(yǔ)言學(xué)專業(yè)，主要研究方向?yàn)檎J(rèn)知語(yǔ)言學(xué)及自然語(yǔ)言處理；首席語(yǔ)言學(xué)家李愛萍則為北京大學(xué)的應(yīng)用語(yǔ)言學(xué)博士。

最具成長(zhǎng)性的AI+教育公司都有哪些特質(zhì)？| CCF-GAIR 2018

前有“老大哥”，后有“新勢(shì)力”，AI+教育江湖誰(shuí)主沉??？

考拉閱讀CEO趙梓淳：如何利用AI、語(yǔ)言學(xué)做出國(guó)內(nèi)首個(gè)中文分級(jí)閱讀系統(tǒng)？

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

張莉

主筆

本人微信：15010591263

發(fā)私信

當(dāng)月熱門文章