0
本文作者: 張莉 | 2018-08-10 10:04 |
雷鋒網(wǎng)消息,近日,中文少兒分級閱讀平臺“考拉閱讀”宣布完成2000萬美金B(yǎng)輪融資。此次融資由GGV紀源資本和XVC共同領投,CMC華人文化產(chǎn)業(yè)基金跟投,原有投資人啟明創(chuàng)投超額跟投。安可資本擔任本輪融資獨家財務顧問。
此次融資將主要用于考拉閱讀原創(chuàng)“中文分級閱讀系統(tǒng)ER Framework”的優(yōu)化升級、優(yōu)質閱讀內容的生產(chǎn)聚合及市場規(guī)模的擴大。
考拉閱讀創(chuàng)始人、CEO趙梓淳強調:“考拉閱讀完成本輪融資后,一方面將繼續(xù)加大在技術和研發(fā)上的投入,推進與高校等研究機構的進一步合作;另一方面則會持續(xù)加大市場投入,開展中學市場的推進,保持公司在中文分級閱讀領域的絕對領先優(yōu)勢。”
另外,據(jù)考拉閱讀透露,在近半年時間里,考拉閱讀的日活用戶增長近百倍,全產(chǎn)品矩陣日活接近百萬,目前學生端次日次周及次月留存均高達70%以上,平均日停留時長約30分鐘。
考拉閱讀創(chuàng)立于2016年9月,據(jù)介紹,考拉閱讀是全球首家提出“中文少兒分級閱讀”概念的創(chuàng)業(yè)公司,依托自主研發(fā),全球首創(chuàng)量化中文分級閱讀系統(tǒng) ER Framework,將中文文本按照難度進行量化分級,并匹配學生不同的閱讀能力,進而提供個性化的閱讀內容及語文學習解決方案。
雷鋒網(wǎng)注:中文分級閱讀系統(tǒng) ER Framework
分級閱讀的關鍵難點之一是“如何科學劃分文本的難度等級”。不同于西方印歐語系繁復的格標記語法系統(tǒng),漢語語法過于靈活、意合語義相當復雜等特點也讓分級閱讀的技術實現(xiàn)面臨嚴峻挑戰(zhàn),要想完成規(guī)?;慕鉀Q方案只能依賴于現(xiàn)代科學技術的發(fā)展。
據(jù)介紹,考拉閱讀歷時兩年,構建起全球最大的中文分級底層語料庫,結合語言學,測量心理學以及深度神經(jīng)網(wǎng)絡為代表的前沿AI算法解決了這一難題。
據(jù)考拉閱讀CTO任易介紹,考拉閱讀的中文分級閱讀標準(ER Framework )借鑒了國外的“詞、句”的分析思想,基于ER Framework的分級閱讀標準在「詞」、「句」的基礎上再加入「字」、「段」、「篇」三個維度,即從「字詞句段篇」五大維度提取幾十個特征來表達中文的難度,并實現(xiàn)段落、主題等的分析。如在「字」其下還有常用性、構形、組合性三個特征,「句」則有句法結構、語義邏輯、修辭表達和嵌套深度四個特征等等。
“因為中文的的句子相較英文要復雜得多,機器在理解中文的第一步就會遇到詞性分析、語言模型上的困難。所以,有賴于現(xiàn)在流行的AI技術,如RNN、LSTM等深度學習技術,可以彌補中文在NLP上的缺失。”任易表示,“現(xiàn)在我們可以做到,將一個句子按照句法樹、依賴關聯(lián)等予以拆解,以分析每一個成分在句子中的比重,從而實現(xiàn)閱讀文本的難度分級?!?/p>
去年此時,考拉閱讀剛完成3000萬的Pre-A輪融資。趙梓淳在接受雷鋒網(wǎng)專訪的時候表示,他們一共處理了幾百萬字的非平衡語料庫和幾億字的平衡語料庫。
據(jù)悉,考拉閱讀相關技術和研究成果已申請多項專利和國家重大課題項目,并獲得北京大學、北京師范大學等權威機構專家認證,構建了從工具到到內容的完整閉環(huán)。
趙梓淳介紹,從技術方面來說,考拉閱讀打造了一個頂尖的科學家團隊,聯(lián)合創(chuàng)始人任易博士畢業(yè)于北京大學,主攻數(shù)據(jù)挖掘方向,曾在 IBM Waston for Life Service 和微軟亞洲研究院工作;首席數(shù)據(jù)科學家顧問趙俊博博士曾在 Facebook 從事研究工作,師從于機器學習頂尖學者、深度學習的奠基人之一 Yann LeCun 教授;首席閱讀測評科學家魏久喬畢業(yè)于北京大學和新加坡國立大學應用語言學專業(yè),主要研究方向為認知語言學及自然語言處理;首席語言學家李愛萍則為北京大學的應用語言學博士。
相關文章:
CNNIC最新報告:K12英語在線教育火爆,AI+教育驅動產(chǎn)業(yè)升級
最具成長性的AI+教育公司都有哪些特質?| CCF-GAIR 2018
考拉閱讀CEO趙梓淳:如何利用AI、語言學做出國內首個中文分級閱讀系統(tǒng)?
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。