0
本文作者: 我在思考中 | 2022-10-12 10:41 |
作者 | 李梅
編輯 | 陳彩嫻
AI 科技評論獲悉,阿里 M6 大模型的原帶頭人楊紅霞,已于 9 月初因個人家庭原因從阿里巴巴達(dá)摩院智能計算實驗室離職。
楊紅霞常年深耕在產(chǎn)業(yè)化大規(guī)模落地的人工智能相關(guān)技術(shù),在任資深算法專家期間帶領(lǐng)團隊探索阿里在下一代人工智能突破性技術(shù)-認(rèn)知智能的技術(shù)發(fā)展與場景應(yīng)用落地。
楊紅霞 2007 年本科畢業(yè)于南開大學(xué),獲統(tǒng)計學(xué)學(xué)士學(xué)位。其后她去往美國杜克大學(xué)統(tǒng)計科學(xué)系攻讀博士學(xué)位,師從 David Dunson 教授。
博士畢業(yè)后,楊紅霞先入職 IBM 全球研發(fā)中心任 Watson 研究員,之后入職雅虎公司,擔(dān)任首席數(shù)據(jù)科學(xué)家。
2016 年,楊紅霞結(jié)束她在美國近 10 年的留學(xué)及工作生涯回國,去往杭州加入阿里巴巴集團。
楊紅霞領(lǐng)導(dǎo)的阿里巴巴達(dá)摩院 M6 團隊致力于認(rèn)知智能方向,目前研發(fā)了 AliGraph、M6、洛犀等較為有影響力的人工智能開源平臺和系統(tǒng),發(fā)表頂級會議、期刊文章超過 100 篇,美國和中國專利超過 30 項。她曾帶領(lǐng)團隊獲 2019 世界人工智能大會最高獎卓越人工智能引領(lǐng)者(Super AI Leader,簡稱 SAIL 獎),2020 年國家科學(xué)技術(shù)進(jìn)步獎二等獎和 2020 年杭州市創(chuàng)新領(lǐng)軍團隊。2022年6月,楊紅霞入選 2022 福布斯中國科技女性50榜。
大模型 M6 是楊紅霞在任期間的最突出成就。據(jù)了解,她離職是因為個人家庭原因,而非行業(yè)問題。達(dá)摩院大模型 M6 團隊的后續(xù)工作不受影響。
M6 于 2021 年 3 月首次發(fā)布,是國內(nèi)首個千億參數(shù)多模態(tài)大模型。當(dāng)時,OpenAI 前政策主管 Jack Clark 曾贊揚道:這個模型的規(guī)模和設(shè)計都非常驚人。這看起來像是眾多中國的 AI 研究組織逐漸發(fā)展壯大的一種表現(xiàn)。
作為通用性 AI 大模型,M6 擁有多模態(tài)、多任務(wù)能力,尤其擅長設(shè)計、寫作、問答,在電商、制造業(yè)、文學(xué)藝術(shù)、科學(xué)研究等領(lǐng)域都具有廣泛應(yīng)用前景。楊紅霞曾在接受采訪時表示:“多模態(tài)預(yù)訓(xùn)練是下一代人工智能的基礎(chǔ),M6 模型實現(xiàn)了訓(xùn)練效率和生成精度等多項突破,是當(dāng)前眾多中文多模態(tài)下游任務(wù)最優(yōu)模型。”
6 月份,楊紅霞團隊又發(fā)布萬億參數(shù)的 M6,僅使用 480 塊GPU,就能實現(xiàn)萬億參數(shù)體量的智能運算。相比原來的百億參數(shù)模型,功耗降低 8 成,效率提升 11 倍。
M6 在當(dāng)年 10 月再次突破極限,楊紅霞團隊使用 512 GPU,在 10 天內(nèi)訓(xùn)練出 10 萬億模型。與大模型 GPT-3 具有同等參數(shù)規(guī)模,但能耗僅為其 1%。
據(jù)了解,M6 已經(jīng)在阿里新制造平臺-犀牛制造中得到應(yīng)用,它服務(wù)內(nèi)部近 50 個部門,并在阿里云對外產(chǎn)品中投入使用,還被收錄在 MIT Tech Review 2021 年度中國 AI 突破技術(shù)報告。
參考鏈接:https://baijiahao.baidu.com/s?id=1746369376161463935&wfr=spider&for=pc
http://www2.stat.duke.edu/~hy35/home.html
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。