0
本文作者: Nemo | 2025-09-02 16:42 |
9月2日,即夢AI攜手火山引擎全面開放API服務(wù),包括文生圖3.0、文生圖3.1、圖生圖3.0、視頻生成3.0pro、數(shù)字人OmniHuman、動(dòng)作模仿DreamActor M1等多款即夢AI同源前沿模型,為企業(yè)級(jí)用戶提供豐富優(yōu)質(zhì)的圖像及視頻生成和編輯服務(wù)。開發(fā)者無需額外申請,通過自助下單即可快速完成接入。
即夢AI系列模型,是即夢AI基于Seedream、Seedance等字節(jié)跳動(dòng)自研模型,針對產(chǎn)品內(nèi)不同應(yīng)用場景和用戶多樣化需求,持續(xù)調(diào)優(yōu)開發(fā)而來。目前,這些模型已經(jīng)在即夢AI產(chǎn)品上得到大規(guī)模驗(yàn)證,能夠適配故事短片創(chuàng)作、營銷物料制作、游戲素材設(shè)計(jì)、多媒體課件制作、自媒體玩法拓展等多種應(yīng)用場景,助力創(chuàng)意高效落地。
依托火山引擎在云服務(wù)、算力調(diào)度、運(yùn)維保障等領(lǐng)域的先進(jìn)技術(shù)能力,即夢AI同款能力API上線后,能夠?qū)崿F(xiàn)高穩(wěn)定性的服務(wù)輸出,為企業(yè)用戶提供全天候技術(shù)支持與運(yùn)維服務(wù),有效降低企業(yè)接入前沿AI模型的技術(shù)門檻與運(yùn)維成本。
即夢AI文生圖3.0可以支持多種海報(bào)場景
其中,即夢AI文生圖3.0、即夢AI文生圖3.1、圖生圖3.0 均為線上最新版本。文生圖3.0專門針對海報(bào)設(shè)計(jì)場景強(qiáng)化了圖文排版、藝術(shù)字體與文字準(zhǔn)確性,生成內(nèi)容更貼近商用設(shè)計(jì)需求,輕松輸出風(fēng)格統(tǒng)一、排版專業(yè)的營銷素材。
文生圖3.1在繼承前代優(yōu)勢的基礎(chǔ)上,進(jìn)一步提升了畫面整體美感和場景豐富度,覆蓋寫實(shí)、國潮、賽博朋克等數(shù)十種風(fēng)格,且還原精準(zhǔn)度大幅提升;色彩搭配、光影層次更具藝術(shù)感,有效提升畫面美感的塑造;同時(shí)還優(yōu)化了畫面細(xì)節(jié)豐富度,小到紋理質(zhì)感、大到場景層次均能清晰呈現(xiàn);該模型對文本指令的響應(yīng)也更加精準(zhǔn),可以高效還原用戶創(chuàng)意構(gòu)想。
圖生圖3.0新增了智能參考編輯功能,支持基于文本指令對圖像進(jìn)行精細(xì)化修改。該能力在兩大核心維度實(shí)現(xiàn)突破:一是精準(zhǔn)執(zhí)行編輯指令,無論是局部元素替換、風(fēng)格轉(zhuǎn)換,還是細(xì)節(jié)調(diào)整,均能精準(zhǔn)匹配用戶需求;二是在編輯過程中,能有效保持圖像內(nèi)容完整性,尤其在處理人物圖像時(shí),可完整保留人物五官特征、姿態(tài)細(xì)節(jié),在真實(shí)圖像優(yōu)化、海報(bào)圖文設(shè)計(jì)等場景中表現(xiàn)突出。
視頻生成3.0Pro具備多鏡頭敘事能力,可根據(jù)文本指令生成包含鏡頭切換、場景過渡的連貫視頻;對創(chuàng)作指令的遵循度更高,能精準(zhǔn)還原場景設(shè)定、人物動(dòng)作等需求;動(dòng)態(tài)表現(xiàn)更流暢自然,人物肢體動(dòng)作、物體運(yùn)動(dòng)軌跡無卡頓;支持生成1080P高清視頻,畫面質(zhì)感達(dá)專業(yè)制作水準(zhǔn),同時(shí)可實(shí)現(xiàn)動(dòng)漫、寫實(shí)、復(fù)古等多元風(fēng)格化表達(dá)。功能上,既支持純文本生成視頻,也支持上傳首幀圖片并搭配文本提示詞生成視頻,滿足多樣化創(chuàng)作需求。
OmniHuman 能夠基于單張圖片與輸入音頻,生成全畫幅可控的數(shù)字人視頻。該模型能夠精準(zhǔn)捕捉音頻中的情緒,驅(qū)動(dòng)數(shù)字人呈現(xiàn)自然流暢的動(dòng)態(tài)變化,無論是高度逼真的人物,還是風(fēng)格多樣的動(dòng)漫卡通形象,皆能實(shí)現(xiàn)生動(dòng)且細(xì)膩的演繹,適用于宣傳帶貨、影視游戲創(chuàng)作、互動(dòng)表演及專業(yè)解說等眾多商業(yè)化場景,有效提升創(chuàng)意表達(dá)與傳播效能。
DreamActor M1是一款基于圖像與視頻模板驅(qū)動(dòng)的人物動(dòng)態(tài)生成模型,支持通過單張圖片和一段模板視頻,精準(zhǔn)還原人物的動(dòng)作、表情及口型,同時(shí)保持原圖片中的主體形象與背景高度一致。該模型在橫屏輸出適配、肢體動(dòng)作表現(xiàn)等方面尤為出色,生成效果穩(wěn)定且逼真,適用于多種視頻合成場景,具備強(qiáng)大的商業(yè)化應(yīng)用潛力,適用于虛擬人創(chuàng)作、內(nèi)容營銷、影視預(yù)制等多類場景。
即夢AI相關(guān)負(fù)責(zé)人介紹,即夢AI自誕生以來,始終致力于幫助創(chuàng)作者解放創(chuàng)意,帶來效率提升,目前在C端產(chǎn)品上已經(jīng)有了嘗試和積累,此次聯(lián)合火山引擎開放API服務(wù),是即夢AI能力從“服務(wù)個(gè)人創(chuàng)意”向“賦能企業(yè)生產(chǎn)”的重要延伸?!拔覀兿M麑⒔?jīng)過大規(guī)模用戶驗(yàn)證的AI能力,通過更穩(wěn)定、更適配企業(yè)需求的方式輸出,幫助企業(yè)快速接入成熟的AI工具,提升創(chuàng)意生產(chǎn)效率”,該負(fù)責(zé)人表示。未來即夢AI將攜手火山引擎持續(xù)拓展API服務(wù)能力,推動(dòng)AI在更多行業(yè)創(chuàng)意場景落地。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。