丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給曉楠
發(fā)送

0

100天后,階躍星辰交出了第二份答卷

本文作者: 曉楠 2024-07-05 21:29
導(dǎo)語:從「走路入場」到「跑步前進」,階躍星辰要加速奔向AGI了。


今年 3 月,「借著」 2024 全球開發(fā)者先鋒大會的場子,「國內(nèi)最后一家通用大模型公司」——階躍星辰發(fā)布了 Step 系列通用大模型,包括 Step-1 千億參數(shù)語言大模型、Step-1V 千億參數(shù)多模態(tài)大模型以及 Step-2 萬億參數(shù) MoE 語言大模型預(yù)覽版,正式進入大眾視野,并成功躋身國內(nèi)六大大模型獨角獸行列。

另外五家分別是月之暗面、智譜、MiniMax、百川、零一萬物。

當時雷峰網(wǎng)(公眾號:雷峰網(wǎng))就報道過,階躍星辰給外界的第一印象是低調(diào)、神秘,雖然早在 2023 年就成立,但出現(xiàn)在公眾視野的也只有微軟出身的 CEO 姜大昕,對于團隊核心成員、技術(shù)進展、產(chǎn)品研發(fā)等信息,外界一概不知。直到臨近一周年之際,正式提交第一份成績單的時候,一切才浮出水面。

當然,這一份成績很是亮眼,一舉將國內(nèi)大模型卷到萬億參數(shù)賽道(預(yù)覽版)。可即便如此,階躍星辰依舊低調(diào)。

進入 2024 年以來,大模型行業(yè)的熱鬧明顯更為多樣化,大模型落地應(yīng)用的主旋律下,行業(yè)模型、端側(cè)模型變熱;世界模擬器 Sora 的亮相,引爆多模態(tài)大模型的流行;走得更早更靠前的 OpenAI 遲遲沒有將 GPT-5 公之于眾,發(fā)布的 GPT-4o,雖然有強大交互能力,但也未能化解大眾對其技術(shù)進化速度放緩的質(zhì)疑、失望……

圍繞「技術(shù)信仰派」VS「市場信仰派」、「模型做大」VS「模型做小」、「Scaling Law 是不是第一性原理」等話題,各路大儒「辯經(jīng)」不止……

仔細看,階躍星辰的聲音似乎很少。

為此,當雷峰網(wǎng)得知階躍星辰也將出席此次的 WAIC 時,充滿期待、好奇,希望探究一下階躍星辰是如何看待當下關(guān)于 AGI 的各種共識與非共識問題。

不過沒想到的是,這次「借著」 WAIC 的場子,階躍星辰又交出了第二份答卷——發(fā)布 Step-2 萬億 MoE 語言大模型正式版、Step-1.5V 多模態(tài)大模型、Step-1X 圖像生成大模型。

而此次的產(chǎn)品升級,距離上次僅僅過去 100 天。

將國內(nèi)大模型升級到「萬億參數(shù)時代」的Step-2長啥樣

3 個多月前,當階躍星辰宣布 Step-2 萬億參數(shù) MoE 語言大模型預(yù)覽版的時候,大家很是好奇,想一覽其真實面目。而今天,在 WAIC 大會現(xiàn)場,吊足了大家胃口的 Step-2 萬億參數(shù) MoE 語言大模型正式版亮相了,它采用當前熱門的 MoE (Mixture of Experts)架構(gòu),又稱「混合專家」,是一種模塊化的稀疏激活,可以讓模型在增大參數(shù)規(guī)模的同時,計算成本遠低于相同參數(shù)規(guī)模下的稠密模型,實現(xiàn)高效訓(xùn)練。

目前,在通往 AGI 的道路上,業(yè)界大多數(shù)人堅信 Scaling Law 定律——模型越大,性能越強,階躍星辰也是其中一家。但是現(xiàn)實問題是,模型的升級迭代離不開算力的支撐,而算力的不足和匱乏,顯然是當下業(yè)界為數(shù)不多的共識之一。

因此,在意識到 MoE 可以解決這一難題時,一些大模型從業(yè)者相繼推出基于 MoE 架構(gòu)的大模型,比如國外的Mistral AI、 xAI,國內(nèi)的 MiniMax、元象科技、DeepSeek AI、階躍星辰等。而階躍星辰是其中少有的、早早將 MoE 架構(gòu)用在萬億參數(shù)規(guī)模大模型的玩家。

姜大昕告訴雷峰網(wǎng),階躍星辰在完成 Step 系列千億模型的訓(xùn)練后,就開始開始訓(xùn)練萬億模型。而想把模型參數(shù)擴大到萬億的話,MoE 幾乎是一個必選項?!妇拖褡隹蒲谢蛘咦龉こ蹋芏鄾Q策就是各個維度之間的最佳平衡,MoE 也是在性能、參數(shù)量、訓(xùn)練成本、推理成本這些維度權(quán)衡下的最佳選擇?!?/p>

而在設(shè)計 Step-2 MoE 架構(gòu)的過程中,階躍星辰還對算法架構(gòu)進行了創(chuàng)新。

具體而言,當前 MoE 模型的訓(xùn)練方式主要有兩種,一種是基于已有模型通過 upcycle(向上復(fù)用)開始訓(xùn)練,即將一個已經(jīng)訓(xùn)練好的大模型的前饋神經(jīng)網(wǎng)絡(luò)權(quán)重復(fù)制若干份,每一份作為一個 expert(專家),組合后就可以把一個非 MoE 模型變成 MoE 模型,參數(shù)量增大的同時,算力需求會小幾個量級,訓(xùn)練效率高。但弊端是上限低,基于拷貝復(fù)制得到的 MoE 模型容易造成專家同質(zhì)化嚴重。

另一種是從頭開始訓(xùn)練,很顯然,缺點在于訓(xùn)練難度高,但優(yōu)勢是能夠獲得更高的模型上限。

而階躍星辰的選擇是完全自主研發(fā)從頭開始訓(xùn)練,通過部分專家共享參數(shù)、異構(gòu)化專家設(shè)計等創(chuàng)新 MoE 架構(gòu)設(shè)計,讓 Step-2 中的每個“專家模型”都得到充分訓(xùn)練。結(jié)果就是不僅總參數(shù)量達到了萬億級別,每次訓(xùn)練或推理所激活的參數(shù)量也超過了當前市面上的大部分 Dense 模型。

此外,在 Step-2 訓(xùn)練過程中,階躍星辰系統(tǒng)團隊還突破了 6D 并行、極致顯存管理、完全自動化運維等關(guān)鍵技術(shù),讓整體的訓(xùn)練過程更為高效。

據(jù)階躍星辰透露,目前,Step-2 萬億參數(shù) MoE 語言大模型在數(shù)理邏輯、編程、中文知識、英文知識、指令跟隨等方面體感全面逼近 GPT-4。

100天后,階躍星辰交出了第二份答卷

此次,除了 Step-2 萬億參數(shù) MoE 語言大模型,階躍星辰還發(fā)布了 Step-1.5V 多模態(tài)大模型,在多模理解和生成統(tǒng)一的技術(shù)路線上實現(xiàn)了快速突破。

在理解上,相較于此前的 Step-1V 多模態(tài)大模型, Step-1.5V 的優(yōu)勢主要體現(xiàn)在三個方面。

一是感知能力全面提升,創(chuàng)新圖文混排訓(xùn)練方法;能夠理解復(fù)雜圖表、流程圖、準確感知物理空間復(fù)雜的幾何位置;能夠處理高分辨率和極限長寬比的圖像。二是基于最新的 Step-2 萬億參數(shù)模型當老師,推理能力大幅提升,能夠根據(jù)圖像內(nèi)容進行各類高級推理任務(wù),如解答數(shù)學(xué)題、編寫代碼、創(chuàng)作詩歌等。三是具備出色的視頻理解能力,不僅能夠準確識別視頻中的物體、人物和環(huán)境,還能夠理解視頻的整體氛圍和人物情緒。

在生成上,階躍星辰發(fā)布 Step-1X 圖像生成大模型,全鏈路自研的 DiT(Diffusion Models with transformer)模型架構(gòu), 可支持 600M、2B 和 8B 三種不同的參數(shù)量;具備更好的文本 prompt 和生成圖片的語義對齊能力、 指令跟隨能力。另外,該模型還支持針對中國元素的深度優(yōu)化,使生成內(nèi)容更適合國人的審美風(fēng)格。

比如,階躍星辰在會場展示的「AI+大鬧天宮」現(xiàn)場互動,游戲背后調(diào)用了多個階躍星辰自研的 Step 系列大模型,融合了圖像理解、風(fēng)格遷移、圖像生成、劇情創(chuàng)作等多種能力,豐富立體地展現(xiàn)了階躍星辰行業(yè)領(lǐng)先的多模態(tài)水平。

動畫片《大鬧天宮》大家一定很熟悉,而今年正是《大鬧天宮》制作完成 60 周年之際。

因此,在這一具有重要紀念意義的時刻,階躍星辰團隊聯(lián)合上影推出了「AI+大鬧天宮」這一款 AI 互動體驗產(chǎn)品,試圖將最先進的 AIGC 和大模型技術(shù)與《大鬧天宮》情境深度融合,用當代的全新視角來展現(xiàn)中國傳統(tǒng)文化的魅力、回顧經(jīng)典動畫作品的藝術(shù)成就,同時也為廣大創(chuàng)作者打開更為廣闊的想象空間、創(chuàng)作空間。

具體而言,在互動過中,用戶需要上傳一張個人照片,基于大模型生成的劇情選擇角色,并與之交談,算法會識別照片的特征,然后結(jié)合《大鬧天宮》的畫風(fēng)和角色進行風(fēng)格遷移生成新的肖像。同時,還將根據(jù)用戶的選擇和回答進一步分析用戶的「MBTI」人格,給用戶在天庭「安排」一個差事。

整體交互過程好玩有趣,且極具個性化,吸引了現(xiàn)場大量觀眾的參與互動。

感興趣的朋友,可以掃描下方圖片二維碼參與互動體驗,「測測你是哪路神仙」。

100天后,階躍星辰交出了第二份答卷

階躍星辰攀頂 AGI 的決心

階躍星辰在 3 月推出的 Step 系列模型,是將近醞釀了一年的成果,而現(xiàn)在距離上一次不過一百天,就實現(xiàn)了對Step 系列模型矩陣的全新升級??梢钥闯鰜?,在通往 AGI 的漫長旅途中,階躍星辰這是從「走路入場」變?yōu)椤概懿角斑M」了。

當前,盡管業(yè)界一次次探討、爭論 AGI 的定義、路徑,但不可否認,在這兩個問題上,至今并未形成一個明確而具體的共識,甚至在未來的一段時間內(nèi)也不會有,每個路線上的攀登者都認為自己將會是最終達到 AGI 終點的選手。姜大昕也是這樣認為的。

從成立一開始,階躍星辰就明確了自身通往 AGI 的路線圖——單模態(tài)—多模態(tài)—多模態(tài)理解和生成的統(tǒng)一—世界模型—AGI。

換句話說,就是以實現(xiàn) AGI 為目標,專注研發(fā)多模態(tài)基礎(chǔ)大模型,基于自研基礎(chǔ)大模型打造新一代「AI +」應(yīng)用。

在這過程中,姜大昕認為,攀登 AGI 巔峰「萬億參數(shù)」和「多模融合」缺一不可!

怎么理解?

一方面,多模態(tài)理解和生成的統(tǒng)一是通向 AGI 的必經(jīng)之路。

另一方面,模型參數(shù)量決定模型能力上限,Scaling Law 全面跨入萬億參數(shù)是通向 AGI 的另一核心。這也是為什么當初在完成 Step 系列千億模型的訓(xùn)練后,階躍星辰就馬不停蹄開始訓(xùn)練萬億模型。

據(jù)了解,此次階躍星辰 Step 系列通用大模型獲得了 WAIC 2024 SAIL 之星稱號。SAIL 獎(Super AI Leader,卓越人工智能引領(lǐng)者)是 WAIC 最高獎項,致力于從全球范圍發(fā)掘在人工智能領(lǐng)域中具有高度認可和美譽、并具有提升人類福祉意義的項目。

不僅是模型要做好,在應(yīng)用上,階躍星辰也沒有松懈。從成立之初,階躍星辰的策略就是技術(shù)和產(chǎn)品「兩手抓」。因為姜大昕堅信,模型需要應(yīng)用作為牽引和數(shù)據(jù)的補充,具體到某個應(yīng)用的時候一定要通過模型與它深度綁定,這樣應(yīng)用才能做到極致,反之亦然。

「我不覺得一個光做應(yīng)用的公司,沒有一個模型跟它深度綁定的話,它能做到極致?!?/p>

為此,基于 Step 系列大模型,階躍星辰通過自研產(chǎn)品和生態(tài)合作產(chǎn)品逐漸形成豐富的產(chǎn)業(yè)應(yīng)用生態(tài)圈,并在重點行業(yè)領(lǐng)先落地。

比如躍問和冒泡鴨,這是階躍星辰自研產(chǎn)品的兩個代表。躍問是一款 AI 聊天類應(yīng)用,定位為個人效率助手;冒泡鴨則是一款由劇情和角色構(gòu)成的 AI 開放世界,可以為用戶提供娛樂和社交。據(jù)了解,目前,兩款產(chǎn)品均已全面開放使用。

而在生態(tài)合作方面,階躍星辰已在金融、網(wǎng)絡(luò)文學(xué)、知識服務(wù)、游戲、數(shù)字人、影視等領(lǐng)域與合作伙伴達成深度合作,共同探索面向 C 端用戶的創(chuàng)新應(yīng)用。

比如這次現(xiàn)場展示的「大鬧天宮」AI 互動體驗,就是階躍攜手上影在影視領(lǐng)域達成的生態(tài)合作伙伴關(guān)系,全程由AI 多模態(tài)大模型生成,以大鬧天宮 IP 動畫為情景,以 AI + IP 生動展示多模態(tài)大模型的底座能力。

接下來,階躍星辰還將繼續(xù)積極探索,并持續(xù)擴大生態(tài)圈,結(jié)交更多生態(tài)伙伴。

寫在最后

今年 3 月份,階躍星辰作為新星正式亮相時,憑借在大模型領(lǐng)域的技術(shù)實力,一舉改變了彼時大模型的「五虎」格局,成功上位,成為「六大獨角獸」一員。

如今,階躍星辰的萬億參數(shù)大模型正式亮相,并不斷獲得行業(yè)、資本市場的認可,或許在不久后,國內(nèi)大模型的格局、位置,又該動一動了。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

100天后,階躍星辰交出了第二份答卷

分享:
相關(guān)文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說