丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給Nemo
發(fā)送

0

字節(jié)Seedream 3.0追平GPT-4o入文生圖第一梯隊!即夢、豆包全量上線,技術報告公開

本文作者: Nemo   2025-04-16 14:59
導語:Seedream 3.0是字節(jié)近日發(fā)布的新一代文生圖主力模型,目前已在即夢、豆包等平臺全量開放。

文生圖領域權威的第三方榜單Artificial Analysis競技場發(fā)布消息稱,字節(jié)跳動Seed團隊圖像生成模型Seedream 3.0綜合性能已追平文生圖SOTA模型GPT-4o,穩(wěn)定超越Recraft V3、Ideogram、Imagen 3、Midjourney V6.1等模型,進入全球第一梯隊。

 

字節(jié)Seedream 3.0追平GPT-4o入文生圖第一梯隊!即夢、豆包全量上線,技術報告公開

 

Seedream 3.0是字節(jié)近日發(fā)布的新一代文生圖主力模型,目前已在即夢、豆包等平臺全量開放。據Seedream 3.0技術報告,Seedream3.0是一個原生高分辨率、支持中英雙語的圖像生成基礎模型,無需后處理即可實現 2K 分辨率圖像直出,適配多比例場景,同時針對小字體高保真生成、多行文本排版等業(yè)界難題,模型也取得了突破性的效果表現。

 

值得一提的是,Seedream 3.0在3秒左右即可快速生成1K分辨率的高品質內容,相比之下,業(yè)界同類模型生成該分辨率內容的耗時基本在10秒以上,而此前文生圖SOTA模型GPT-4o平均耗時為77秒。

 

字節(jié)Seedream 3.0追平GPT-4o入文生圖第一梯隊!即夢、豆包全量上線,技術報告公開

圖注:Seedream3.0 技術報告中評測結果

 

豆包大模型團隊推文介紹稱,Seedream3.0研發(fā)始于2024年末,通過調研設計師等群體的實際需求,團隊不僅將圖文匹配、結構、美感等行業(yè)共識性指標納入攻堅方向,同時,也將挑戰(zhàn)小字生成與復雜文本排版、2K高清直出、快速圖片生成等難題作為核心目標。

 

針對2K分辨率、多尺寸圖像直出能力實現,團隊借助了Transformers 架構對變長輸入序列的靈活處理能力,在從 512x512 到2048x2048 的多種分辨率和不同長寬比上混合訓練,讓模型實現不經過額外深加工的高清直出,同時也支持多種分辨率輸出。

 

為支持快速生成高品質圖像,模型采用自研推理加速算法,依靠一致性噪聲預測,疊加重要時間步采樣,最終實現對模型的無損加速。在保障圖文匹配、美學質量、結構準確度等指標的前提下,Seedream 3.0 生成1K分辨率圖像僅需 3 秒。

 

字節(jié)Seedream 3.0追平GPT-4o入文生圖第一梯隊!即夢、豆包全量上線,技術報告公開

圖注:Seedream3.0輸出圖像細節(jié)豐富,蝴蝶絨毛根根分明

 

Seedream3.0還大幅提升了小字體高保真生成、多行文本語義排版表現,滿足設計師對海報設計的需求。團隊在預訓練階段,引入跨模態(tài)旋轉位置編碼,補足傳統(tǒng)方法模態(tài)特征對齊短板,進一步加強了文字渲染能力。

 

字節(jié)Seedream 3.0追平GPT-4o入文生圖第一梯隊!即夢、豆包全量上線,技術報告公開

圖注:Seedream3.0模型可完成小字生成、多行文本排版,并兼顧畫面美感

 

據Seedream團隊介紹,相比此前2.0版本,Seedream 3.0 在數據和RLHF階段也使用了全新方案。團隊采用缺陷感知的訓練策略,使有效數據集擴充超過20%,同時設計了精準的美感描述維度,并進一步拓展RLHF獎勵模型,使Seedream 3.0 具備多維度質量判別能力,綜合性能大幅提升。

 

字節(jié)Seedream 3.0追平GPT-4o入文生圖第一梯隊!即夢、豆包全量上線,技術報告公開

圖注:Seedream3.0在美感等方面較2.0進一步提升

 

Seedream團隊表示,“新模型在海報創(chuàng)作、生成效率、結構與美感等方面取得了明顯進步,但在生成可用性、美感與結構、智能化方面仍有提升空間。”

 

據了解,未來,團隊計劃探索更高效的結構設計,包括構建效果更好、成本更低、生成更快的文生圖模型,并進一步拓展模型對世界知識的理解,賦予模型交織生成等能力。同時,團隊也計劃探索數據、模型量級、獎勵模型等維度的Scaling現象,將認知積累應用于下一代模型中。

 

Seedream 3.0 技術報告:https://arxiv.org/abs/2504.11346

Seedream 3.0 官方網頁:https://team.doubao.com/zh/tech/seedream3_0

 

 


雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說