曝微軟大牛童欣離職；CharacterAI資金斷裂，計(jì)劃賣身谷歌Meta；馬斯克自曝Grok-3用了10萬(wàn)塊H100丨AI情報(bào)局

本文作者：我在思考中

2024-07-03 09:59

導(dǎo)語(yǔ)：產(chǎn)品推薦：Briefy.AI，F(xiàn)abric，Superhuman 2.0

情報(bào)前線

微軟全球合伙人、微軟亞洲研究院首席研究員童欣離職：據(jù)悉，童欣于 1993 年和 1996 年獲得浙江大學(xué)本科和碩士學(xué)位，1999 年從清華大學(xué)博士畢業(yè)后加入微軟亞洲研究院。同時(shí)擔(dān)任中國(guó)科學(xué)技術(shù)大學(xué)兼職教授，博士生導(dǎo)師。童欣的主要研究方向是計(jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺。作為微軟亞洲研究院網(wǎng)絡(luò)圖形組首席研究員，他在微軟從事圖形學(xué)研究25 年。

曝微軟大牛童欣離職；CharacterAI資金斷裂，計(jì)劃賣身谷歌Meta；馬斯克自曝Grok-3用了10萬(wàn)塊H100丨AI情報(bào)局

融資快報(bào)

Character AI融資困難，計(jì)劃出售給谷歌和Meta：由谷歌前員工創(chuàng)立的AI獨(dú)角獸公司Character AI，曾因角色扮演聊天產(chǎn)品而備受矚目。盡管A16Z曾以10億美元估值投資1.5億美元，但隨著市場(chǎng)新鮮感消退和競(jìng)爭(zhēng)加劇，公司面臨融資困難，正考慮出售給谷歌或Meta，Character AI與這些科技巨頭探討了潛在合作，包括計(jì)算資源和知識(shí)產(chǎn)權(quán)共享。同時(shí)，公司也在尋求新的收入來源，如廣告和API訪問，以維持增長(zhǎng)。

Zeroeyes獲5300萬(wàn)美元B輪融資:Zeroeyes是美國(guó)國(guó)土安全部指定的唯一人工智能驅(qū)動(dòng)的槍支檢測(cè)視頻分析平臺(tái)的開發(fā)者。索倫森資本牽頭的這一輪投資還包括英特爾資本、博德萊特資本和現(xiàn)有投資者。

Northern Data考慮將人工智能部門在美國(guó) IPO：總部位于德國(guó)的 Northern Data AG 正在考慮在美國(guó)進(jìn)行首次公開募股，以高達(dá) 160 億美元的估值出售其人工智能云計(jì)算和數(shù)據(jù)中心部門。該公司提供高性能計(jì)算基礎(chǔ)設(shè)施，并計(jì)劃最早于明年上半年，將由其云計(jì)算部門 Taiga 和數(shù)據(jù)中心組成的實(shí)體（名為 Ardent）在納斯達(dá)克證券交易所上市。

AI初創(chuàng)公司Abnormal Security估值將達(dá)50億美元：Abnormal Security利用人工智能檢測(cè)異常行為，防范商務(wù)電郵入侵等網(wǎng)絡(luò)安全威脅。此前，Abnormal Security已完成C輪融資2.1億美元，由Insight Partners領(lǐng)投，Greylock Partners 和Menlo Ventures跟投，當(dāng)時(shí)估值40億美元。

壹號(hào)智能完成天使輪融資：壹號(hào)智能是一家智能倉(cāng)儲(chǔ)機(jī)器人研發(fā)生產(chǎn)商，聚焦密集存儲(chǔ)細(xì)分賽道。本輪融資由合肥市新站區(qū)天使投資基金投資。

橋水啟動(dòng)由機(jī)器學(xué)習(xí)決策的20億美元規(guī)模基金：對(duì)沖基金巨頭橋水公司最新推出了一只由機(jī)器學(xué)習(xí)運(yùn)行并進(jìn)行決策的基金。據(jù)了解，該基金從不到10位客戶那里獲得了大約20億美元的資金。新投資工具由聯(lián)席首席投資官Greg Jensen牽頭，已開始交易。目前新基金依靠橋水公司研發(fā)了十多年的專有技術(shù)，據(jù)知情人士透露，新基金還將擴(kuò)大范圍，納入OpenAI、Anthropic和Perplexity等公司開發(fā)的模型。

ETW獲得200萬(wàn)美元戰(zhàn)略投資：ETW是一家區(qū)塊鏈項(xiàng)目研發(fā)商，主要從事人工智能游戲技術(shù)研發(fā)、AI算法研發(fā)業(yè)務(wù)，以提升游戲的智能化、個(gè)性化互動(dòng)以及游戲情節(jié)的深度和復(fù)雜度，從而為全球玩家?guī)砀鼮樯羁毯统两降挠螒蝮w驗(yàn)。ETW宣布獲哈佛大學(xué)的200萬(wàn)美元戰(zhàn)略投資。

（歡迎添加微信AIyanxishe2，了解更多AIGC、融資情況，與志同道合的朋友一同暢聊時(shí)新AI產(chǎn)品）

國(guó)內(nèi)情報(bào)：

中國(guó)首款全尺寸人形機(jī)器人“青龍”將于 2024 世界人工智能大會(huì)亮相并開源：

大會(huì)現(xiàn)場(chǎng)將發(fā)布國(guó)內(nèi)首款全尺寸通用人形機(jī)器人開源公版機(jī)“青龍”和首個(gè)全尺寸人形機(jī)器人開源社區(qū) OpenLoong?！扒帻垺鄙砀?182 厘米，體重 82 公斤，全身多達(dá) 43 個(gè)主動(dòng)自由度，最大關(guān)節(jié)峰值扭矩 400 牛米，算力支持 400Tops。此外，特斯拉 Optimus 二代也將在 WAIC 2024 迎來首發(fā)。

月之暗面 Kimi 開放平臺(tái)“上下文緩存”開啟公測(cè)：

該功能通過預(yù)先存儲(chǔ)頻繁請(qǐng)求的數(shù)據(jù)，可以在不增加 API 價(jià)格的情況下，降低最高 90% 的長(zhǎng)文本大模型使用成本，并提升模型響應(yīng)速度，首 Token 延遲降低 83%。

適用場(chǎng)景包括 QA Bot、文檔集合查詢、靜態(tài)代碼庫(kù)或知識(shí)庫(kù)分析、爆款 AI 應(yīng)用以及 Agent 類應(yīng)用等。計(jì)費(fèi)方式主要分為 Cache 創(chuàng)建費(fèi)用、Cache 存儲(chǔ)費(fèi)用和 Cache 調(diào)用費(fèi)用。公測(cè)期間，該功能首先開放給 Tier5 等級(jí)用戶，其他用戶的開放時(shí)間待定。

優(yōu)必選與一汽-大眾達(dá)成合作，打造“人形機(jī)器人”超級(jí)無人汽車工廠：

一汽-大眾將向優(yōu)必選開放其位于青島的“國(guó)家級(jí)智能制造示范工廠”生產(chǎn)線應(yīng)用場(chǎng)景，引入工業(yè)版人形機(jī)器人 Walker S 開展汽車制造過程中的螺栓擰緊、零件安裝、零件轉(zhuǎn)運(yùn)等工作。此前，優(yōu)必選工業(yè)版人形機(jī)器人 Walker S 已進(jìn)入蔚來第二先進(jìn)制造基地總裝車間、東風(fēng)柳汽總裝車間等多家車廠。

阿里媽媽獲國(guó)際計(jì)算機(jī)大會(huì)比賽主辦權(quán)：

阿里媽媽基于入選國(guó)際計(jì)算機(jī)大會(huì)NeurIPS 2024的“大規(guī)模拍賣中的自動(dòng)出價(jià)”賽題，正式啟動(dòng)全球范圍的參賽選手征集。此賽題出自北大-阿里媽媽人工智能創(chuàng)新聯(lián)合實(shí)驗(yàn)室。同時(shí)，阿里媽媽獲得NeurIPS比賽主辦權(quán)。據(jù)了解，北大-阿里媽媽人工智能創(chuàng)新聯(lián)合實(shí)驗(yàn)室是北京大學(xué)聯(lián)合阿里媽媽共建的校企聯(lián)合研發(fā)平臺(tái)，重點(diǎn)研究方向包括決策智能、大規(guī)模圖預(yù)訓(xùn)練模型、智能音樂生成等。

2B大模型戰(zhàn)勝20B，國(guó)產(chǎn)新框架高效處理視覺任務(wù)：

Prism 框架是上海 AI Lab、南京大學(xué)、香港中文大學(xué)等共同開發(fā)的一種專門針對(duì)視覺語(yǔ)言任務(wù)的兩階段框架。它將 VLM 的感知和推理能力顯式解耦，在感知階段，VLM 負(fù)責(zé)提取圖像視覺信息并以文本形式輸出；在推理階段，ChatGPT 等大型語(yǔ)言模型根據(jù) VLM 提供的文本信息和輸入文本生成回復(fù)。這種分離的方法提高了處理視覺語(yǔ)言任務(wù)的效率，使得 2B VLM 與 ChatGPT 的組合能夠達(dá)到相當(dāng)于 10 倍參數(shù)量 VLM 的性能。

姚班大神陳立杰獲UC伯克利教職，2025年秋季入職：

陳立杰將于 2025 年秋季任加州大學(xué)伯克利分校 EECS 助理教授。他 1995 年出生，是清華大學(xué)姚班知名校友，2016 年清華特等獎(jiǎng)學(xué)金得主，也是首位在 FOCS 上發(fā)表論文的中國(guó)本科生。

更多國(guó)內(nèi)情報(bào)：

騰訊搜狗輸入法上線AI 幫寫、AI 對(duì)話、快捷問答、AI 寵物和 AI 自拍表情等功能：此次 AI 升級(jí)使輸入法從簡(jiǎn)單輸入向智能輔助轉(zhuǎn)變，改變輸入法的互動(dòng)方式，提供內(nèi)容創(chuàng)作、信息查詢和娛樂互動(dòng)等多方面服務(wù)。

騰訊云推出星脈網(wǎng)絡(luò)2.0 大模型訓(xùn)練再提速20%：通過升級(jí)硬件和軟件，提高大模型訓(xùn)練的效率，具體包括支持更大規(guī)模的集群網(wǎng)絡(luò)、提升通信協(xié)議性能、優(yōu)化集合通信庫(kù)，以及引入靈境仿真平臺(tái)。

網(wǎng)易有道推出有道詞典筆X7：該產(chǎn)品內(nèi)置AI攝像頭，并搭載國(guó)內(nèi)首個(gè)教育大模型“子曰”的兩款應(yīng)用功能，AI全科家庭教師小P老師、虛擬人口語(yǔ)私教Hi Echo。

聯(lián)合國(guó)大會(huì)通過中國(guó)提出的加強(qiáng)人工智能能力建設(shè)國(guó)際合作決議：140 多國(guó)聯(lián)署決議，強(qiáng)調(diào)人工智能發(fā)展應(yīng)堅(jiān)持以人為本、造福人類等原則，鼓勵(lì)國(guó)際合作，幫助發(fā)展中國(guó)家加強(qiáng)人工智能能力建設(shè)。

四部門印發(fā)《國(guó)家人工智能產(chǎn)業(yè)綜合標(biāo)準(zhǔn)化體系建設(shè)指南(2024版)》：到 2026 年，計(jì)劃通過提高標(biāo)準(zhǔn)與產(chǎn)業(yè)科技創(chuàng)新的聯(lián)動(dòng)水平，新制定 50 多項(xiàng)國(guó)家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn)，推動(dòng)人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展，這是中國(guó)在人工智能領(lǐng)域標(biāo)準(zhǔn)化方面的重大布局。

國(guó)際情報(bào)：

蘋果發(fā)布 AI 大模型 4M：

蘋果與瑞士聯(lián)邦理工學(xué)院洛桑分校合作，在 Hugging Face Spaces 平臺(tái)推出4M AI 模型的公開演示版。距離該模型首次開源已有七個(gè)月，4M 演示版能夠處理和生成包括圖像、文本和 3D 場(chǎng)景在內(nèi)的多種模態(tài)內(nèi)容，用戶可以通過文本描述生成圖像，進(jìn)行物體識(shí)別，甚至使用自然語(yǔ)言操控 3D 場(chǎng)景。

TikTok開發(fā)新AI聊天Genie，已申請(qǐng)商標(biāo)，服務(wù)海外用戶：

Genie 商標(biāo)已在美國(guó)申請(qǐng)，預(yù)計(jì)該聊天機(jī)器人將允許用戶在直播中提出問題并獲得即時(shí)答復(fù)等功能，集成了 TikTok 的多種 AI 元素，包括生成式人工智能搜索功能，該功能已在抖音中文版推出，并且正在開發(fā) AI 音樂生成、文本轉(zhuǎn)視頻創(chuàng)建等工具。此外，TikTok 還在開發(fā) StreamVoice 系統(tǒng)，該系統(tǒng)能夠模擬人的聲音，以及虛擬人直播功能。

ECCV 2024錄用率或創(chuàng)新低，2395篇論文中選：

ECC2024 錄用 2395 篇論文，提交量約 12600 篇，錄用率 18%創(chuàng)新低。作為對(duì)比，CVPR 2024 錄用率 23.6%，ECCV 2022 錄用率 28%。

RunwayGen-3向所有人開放，媲美Sora：

Gen-3 目前每次只能生成 11 秒 720P 視頻且無背景音樂，沒有免費(fèi)試用，每月至少 12 美元。Runway 的 Gen-2 及其他產(chǎn)品免費(fèi)，另外Gen-3會(huì)提供運(yùn)動(dòng)畫筆、相機(jī)控制、導(dǎo)演模式等高級(jí)功能，幫助用戶制作更精良的視頻。

英偉達(dá)發(fā)布直播神器NVIDIA Broadcast，加點(diǎn)AI提升直播質(zhì)量：

NVIDIA Broadcast 是專為 RTX GPU 用戶設(shè)計(jì)的應(yīng)用程序，具有噪音和回聲去除、虛擬背景、自動(dòng)對(duì)焦、視頻噪點(diǎn)去除和眼神接觸等功能，支持多種應(yīng)用程序，如 Discord、Google Meet、Microsoft Teams 等，能提供專業(yè)和創(chuàng)意的直播體驗(yàn)。

Anthropic推出新計(jì)劃，資助新一代AI基準(zhǔn)測(cè)試的開發(fā):

該計(jì)劃鼓勵(lì)開發(fā)者參與基準(zhǔn)測(cè)試評(píng)估工作，旨在提升 AI 安全領(lǐng)域水平，為研究人員提供工具。Anthropic 認(rèn)為目前 AI 基準(zhǔn)測(cè)試無法反映實(shí)際情況，呼吁對(duì)模型進(jìn)行網(wǎng)絡(luò)攻擊、增強(qiáng)大規(guī)模殺傷性武器能力以及操縱或欺騙人們的能力測(cè)試。

全球首個(gè)神經(jīng)連接機(jī)械腿，截肢者恢復(fù)自然行走：

麻省理工學(xué)院研究團(tuán)隊(duì)開發(fā)出一種新型機(jī)械腿，通過神經(jīng)接口和興奮劑 - 拮抗劑肌神經(jīng)接口的手術(shù)方法，使膝蓋以下截肢患者能夠通過自身神經(jīng)信號(hào)控制機(jī)械腿的運(yùn)動(dòng)，恢復(fù)自然的步態(tài)和肢體在空間中的位置感。

OpenAI CEO 奧特曼稱GPT-5 將帶來“巨大飛躍”：

奧特曼表示開發(fā)GPT-5還需要一些時(shí)間，并表示它將是“巨大飛躍（significant leap forward）”。此前，奧特曼曾公開表示 GPT-4 “有些糟糕”，并委婉地稱之為“充其量只是有點(diǎn)尷尬”。

奧特曼解釋說：“我希望它能取得重大飛躍。GPT-4 經(jīng)常犯很多錯(cuò)誤，比如在推理方面表現(xiàn)不佳，有時(shí)還會(huì)完全跑偏，犯下低級(jí)錯(cuò)誤，就像連一個(gè)六歲孩子都不會(huì)犯的一樣。”奧特曼關(guān)于 GPT-5 的言論暗示，這個(gè)模型可能仍處于早期開發(fā)階段。這可能歸因于復(fù)雜算法、數(shù)據(jù)問題以及 GPT-5 本身龐大的體量。

價(jià)值近300億，馬斯克稱訓(xùn)練Grok-3用了10萬(wàn)塊英偉達(dá)H100：

馬斯克表示，訓(xùn)練 AI 聊天機(jī)器人需要數(shù)據(jù)集，而且從現(xiàn)有數(shù)據(jù)中清除大型語(yǔ)言模型的工作量很大。他還談到了 OpenAI 模型輸出訓(xùn)練的幾個(gè)問題。他透露 xAI 的 Grok-3 用了 10 萬(wàn)塊英偉達(dá) H100 芯片進(jìn)行訓(xùn)練，預(yù)計(jì)將于年底發(fā)布，相信它會(huì)“非常特別”。

比爾·蓋茨稱Scaling Law快要走到盡頭，超人AI還需新的突破：

比爾·蓋茨討論了人工智能的發(fā)展，強(qiáng)調(diào)其在醫(yī)療、教育和生產(chǎn)力中的重要性。他認(rèn)為 AI 將影響合成生物學(xué)和機(jī)器人技術(shù)，并預(yù)測(cè)個(gè)人智能體會(huì)通過耳機(jī)、眼鏡等設(shè)備與人類交互。蓋茨指出，AI 的真正進(jìn)步在于實(shí)現(xiàn)更接近人類的元認(rèn)知能力，而非僅擴(kuò)大模型規(guī)模。他預(yù)期 AI 將提升生產(chǎn)率并改善生活質(zhì)量，但也提醒需警惕技術(shù)發(fā)展對(duì)社會(huì)的影響。

更多國(guó)際情報(bào)：

Adobe發(fā)布全新改進(jìn)的Content Hub，具備生成式AI功能:該平臺(tái)集成了 Adobe Experience Manager Assets，旨在幫助企業(yè)高效管理數(shù)字資產(chǎn)，優(yōu)化內(nèi)容供應(yīng)鏈，并提升營(yíng)銷活動(dòng)和數(shù)字體驗(yàn)的創(chuàng)建。

全球首例，法國(guó)反壟斷機(jī)構(gòu)準(zhǔn)備對(duì)英偉達(dá)出手：違反反壟斷法的公司可能面臨高達(dá)其全球年?duì)I業(yè)額10%的罰款，以英偉達(dá)2024財(cái)年609億美元的營(yíng)收來計(jì)算，罰款金額最高可達(dá)60.9億美元。

遭攝影師投訴后，Instagram將“Made with AI”標(biāo)簽換成“AI info”：此前用戶僅使用Adobe的裁剪工具和拼合圖像就會(huì)觸發(fā)該標(biāo)簽。

YouTube 允許用戶請(qǐng)求刪除模擬的面部或聲音的 AI 生成內(nèi)容：受影響的個(gè)人可以基于隱私侵犯理由，通過YouTube的隱私請(qǐng)求流程要求刪除AI生成的內(nèi)容。

AWS承諾投入5000萬(wàn)美元支持公共部門生成式AI創(chuàng)新：旨在通過提供云信用和先進(jìn)的 AI 基礎(chǔ)設(shè)施，加速公共部門在生成式 AI 領(lǐng)域的創(chuàng)新。這個(gè)計(jì)劃預(yù)計(jì)將持續(xù)兩年，并提供對(duì) AWS 服務(wù)的訪問權(quán)限。

到2027年，Deepfakes帶來的損失將達(dá)到400億美元：復(fù)合年增長(zhǎng)率將達(dá)到驚人的32%。預(yù)計(jì)到2024年，此類事件將增加50%至60%，全球?qū)⒂?40000-150000起此類事件。德勤預(yù)計(jì)，銀行和金融服務(wù)將成為主要目標(biāo)。

Product Hunt 熱榜，智能摘要工具Briefy.AI

Briefy是一款創(chuàng)新的人工智能摘要工具，能夠?qū)⒏鞣N長(zhǎng)篇內(nèi)容快速轉(zhuǎn)換成結(jié)構(gòu)化摘要。這款工具支持文章、視頻、郵件和播客等多種內(nèi)容類型，并提供概覽、表格、思維導(dǎo)圖等多種視圖展示方式。用戶可以在個(gè)人知識(shí)庫(kù)中方便地管理和回顧這些摘要，還能使用自然語(yǔ)言搜索快速找到所需信息。

Briefy的多語(yǔ)言支持和全設(shè)備兼容性使其成為學(xué)生、專業(yè)人士和內(nèi)容創(chuàng)作者的理想選擇。用戶反饋顯示，Briefy極大地提高了閱讀效率，并在理解復(fù)雜主題時(shí)提供了顯著幫助。

?https://briefy.ai/?ref=producthunt

GitHub Trending 熱榜，增強(qiáng)人類能力的開源框架 AI助手Fabric

Fabric是一個(gè)創(chuàng)新的開源框架，旨在通過AI技術(shù)放大人類創(chuàng)造力。一個(gè)為了解決特定問題而提供的模塊化框架，通過一個(gè)由人群源提供的 AI 提示集來實(shí)現(xiàn)，這些提示可以在任何地方使用，包括可選的服務(wù)器（Mill）、AI使用案例（Patterns）和客戶端應(yīng)用（Looms），讓用戶能輕松應(yīng)用AI解決特定問題。

這個(gè)命令行原生的工具支持自定義模式和輔助應(yīng)用，使用簡(jiǎn)單yet功能強(qiáng)大。未來，F(xiàn)abric計(jì)劃轉(zhuǎn)向Go語(yǔ)言，以提供更流暢的用戶體驗(yàn)。無論是分析YouTube視頻還是處理復(fù)雜數(shù)據(jù)，F(xiàn)abric都為AI輔助人類工作開辟了新途徑。

?https://danielmiessler.com/p/fabric-origin-story

開發(fā)者推薦，AI 賦能郵件管理新工具 Superhuman 2.0

Superhuman公司最近發(fā)布了其電子郵件管理工具的2.0版本，旨在通過人工智能和一系列高級(jí)功能提升用戶處理郵件的效率。該工具針對(duì)使用Gmail或Outlook的團(tuán)隊(duì)設(shè)計(jì)，聲稱能幫助用戶以兩倍于以往的速度處理郵件，每年為團(tuán)隊(duì)節(jié)省超過1000萬(wàn)小時(shí)。

Superhuman 2.0整合了多項(xiàng)功能，包括AI輔助寫作、智能收件箱分類、自動(dòng)跟進(jìn)提醒等。用戶反饋表明，這些功能有助于加快決策速度，提供更高質(zhì)量的回復(fù)，并讓團(tuán)隊(duì)成員更專注于重要工作。然而，具體效果可能因個(gè)人使用習(xí)慣和團(tuán)隊(duì)需求而異。

?https://superhuman.com/?ref=producthunt

前沿技術(shù)

1.北大港科大聯(lián)手推進(jìn)醫(yī)療AI：模型性能達(dá)GPT-4水平

北京大學(xué)和香港科技大學(xué)的研究團(tuán)隊(duì)最近在醫(yī)療人工智能領(lǐng)域取得重大進(jìn)展。他們提出了一種新的醫(yī)療專家模型訓(xùn)練方法，成功將8B規(guī)模的模型性能提升至接近GPT-4的水平。研究中引入的"穩(wěn)定性差距"概念有效解決了大語(yǔ)言模型持續(xù)預(yù)訓(xùn)練中的問題。

該團(tuán)隊(duì)通過優(yōu)化訓(xùn)練策略，在醫(yī)療領(lǐng)域?qū)崿F(xiàn)了顯著效果，同時(shí)大幅減少了計(jì)算資源消耗。這項(xiàng)研究成果已在HuggingFace平臺(tái)上開源，為醫(yī)療AI的發(fā)展提供了新的可能性。這一突破展示了大語(yǔ)言模型在特定領(lǐng)域應(yīng)用的潛力，可能對(duì)未來醫(yī)療實(shí)踐產(chǎn)生深遠(yuǎn)影響。

?https://arxiv.org/abs/2406.14833

2.MotionClone：無需訓(xùn)練的動(dòng)作克隆技術(shù)引領(lǐng)視頻生成新時(shí)代

中國(guó)科學(xué)技術(shù)大學(xué)、上海交通大學(xué)等多所高校的研究團(tuán)隊(duì)近日提出了一種名為MotionClone的創(chuàng)新視頻生成框架。這項(xiàng)技術(shù)突破性地實(shí)現(xiàn)了無需訓(xùn)練的動(dòng)作克隆，能夠從參考視頻中提取動(dòng)作，并通過時(shí)序注意力指導(dǎo)和位置感知語(yǔ)義指導(dǎo)兩大核心組件，對(duì)文本到視頻的生成過程進(jìn)行全面控制。

MotionClone的出現(xiàn)解決了傳統(tǒng)方法在跨領(lǐng)域應(yīng)用時(shí)可能出現(xiàn)的動(dòng)作生成問題，同時(shí)提升了生成模型對(duì)空間關(guān)系的合成能力和對(duì)提示的遵循程度。這一突破性成果不僅展示了AI在視頻生成領(lǐng)域的巨大潛力，也為未來的創(chuàng)意產(chǎn)業(yè)和內(nèi)容創(chuàng)作開辟了新的可能性。

?https://bujiazi.github.io/motionclone.github.io/

3.MimicMotion：騰訊聯(lián)手上交大打造新一代人體動(dòng)作視頻生成器

騰訊與上海交通大學(xué)的研究團(tuán)隊(duì)近日推出了名為MimicMotion的創(chuàng)新人體運(yùn)動(dòng)視頻生成框架。這一突破性技術(shù)旨在生成任意長(zhǎng)度的高質(zhì)量視頻，通過融合圖像到視頻擴(kuò)散模型和引入置信度感知的姿態(tài)指導(dǎo)，顯著提升了生成視頻的時(shí)間一致性和細(xì)節(jié)豐富度。

MimicMotion在多個(gè)方面超越了現(xiàn)有技術(shù)，尤其在手部細(xì)節(jié)生成和長(zhǎng)視頻平滑過渡方面表現(xiàn)卓越。研究團(tuán)隊(duì)通過大量實(shí)驗(yàn)和用戶研究，證實(shí)了該框架在視頻質(zhì)量、時(shí)間一致性和對(duì)參考姿態(tài)的準(zhǔn)確遵循等方面的優(yōu)勢(shì)。這一成果不僅推動(dòng)了AI視頻生成技術(shù)的進(jìn)步，也為未來虛擬內(nèi)容創(chuàng)作和數(shù)字娛樂產(chǎn)業(yè)開辟了新的可能性。

?https://tencent.github.io/MimicMotion/

4.Mobile-Agent-v2: 通過多代理協(xié)作有效導(dǎo)航的移動(dòng)設(shè)備操作助手

Mobile-Agent-v2 是由北京交通大學(xué)和阿里巴巴集團(tuán)聯(lián)合開發(fā)的一個(gè)移動(dòng)設(shè)備操作助手，它旨在通過多代理協(xié)作解決長(zhǎng)上下文圖文交錯(cuò)輸入中的導(dǎo)航問題。該系統(tǒng)采用了增強(qiáng)的視覺感知模塊以及 GPT-4o 技術(shù)，以提高操作的準(zhǔn)確率和效率。目前，Mobile-Agent-v2 支持的系統(tǒng)有安卓和鴻蒙（版本號(hào)小于等于 4），而 iOS 系統(tǒng)暫時(shí)不支持。使用前需要安裝依賴、通過 ADB 連接移動(dòng)設(shè)備、安裝 ADB 鍵盤，并配置 run.py 文件中的設(shè)置，包括 ADB 路徑、指令、GPT-4 API URL 和 Token。用戶可以根據(jù)自己的設(shè)備性能選擇本地部署圖標(biāo)描述模型還是通過 API 調(diào)用方式，并可以根據(jù)需要添加操作知識(shí)以提高準(zhǔn)確性。此外，通過調(diào)整 “反思智能體” 和 “內(nèi)存單元” 的開關(guān)，可以進(jìn)一步提升移動(dòng)設(shè)備的效率。

?https://github.com/X-PLUG/MobileAgent

5.騰訊推出革命性多智能體翻譯工具TransAgents，免費(fèi)試用中！

騰訊最新推出的TransAgents翻譯工具，這款基于GPT-4的多智能體協(xié)作系統(tǒng)不僅能高質(zhì)量翻譯網(wǎng)絡(luò)文學(xué)，更開放免費(fèi)在線試用。只需上傳txt或pdf文件，TransAgents就能為你呈現(xiàn)專業(yè)級(jí)翻譯。

TransAgents采用創(chuàng)新的多Agent協(xié)作模式，涵蓋翻譯、文化適應(yīng)、校對(duì)等全方位服務(wù)。已成功翻譯20本網(wǎng)文，獲得讀者青睞。無論你是文學(xué)愛好者還是專業(yè)譯者，都不容錯(cuò)過這次AI翻譯！

? http://transagents.ai

大牛洞見

AI革命：從數(shù)字物種到信息處理巨人

Mustafa Suleyman，微軟 AI 首席執(zhí)行官，也是當(dāng)前許多人使用的 AI 模型之一的主要建造者，在 TED2024 大會(huì)上發(fā)表演講，探討了人工智能的本質(zhì)問題。他指出，即使是 AI 領(lǐng)域的專家也在努力描述這一技術(shù)的未來方向。Suleyman 提供了一個(gè)新的數(shù)字物種隱喻，旨在將注意力集中在人工智能領(lǐng)域的這一關(guān)鍵時(shí)刻。他的演講后續(xù)還包括了與 TED 首席執(zhí)行官 Chris Anderson 的問答環(huán)節(jié)。演講內(nèi)容涵蓋了技術(shù)、計(jì)算機(jī)、創(chuàng)新、未來、人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域。此外，還引發(fā)Reddit用戶的熱烈討論，

展示AI驚人的數(shù)據(jù)處理能力：月訓(xùn)練量達(dá)8萬(wàn)億字

專家和網(wǎng)友都在努力理解AI的本質(zhì)和未來方向

AI學(xué)習(xí)效率vs人類：缺乏感知能力，但數(shù)據(jù)處理量巨大

警惕AI"幻覺"問題，強(qiáng)調(diào)人為核實(shí)的重要性

AI數(shù)據(jù)收集引發(fā)倫理思考

? https://www.ted.com/talks/mustafa_suleyman_what_is_an_ai_anyway?language=en&subtitle=en

敬請(qǐng)期待明日的最新動(dòng)態(tài)！

AI情報(bào)局征集情報(bào)合伙人，匯集獨(dú)家價(jià)值線索！如果您可以提供有關(guān)AI最新成果&行業(yè)內(nèi)幕&獨(dú)特產(chǎn)品，請(qǐng)?zhí)砑舆\(yùn)營(yíng)微信號(hào)：AIyanxishe2備注行業(yè)崗位。

雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

我在思考中

運(yùn)營(yíng)

發(fā)私信

當(dāng)月熱門文章

曝微軟大牛童欣離職；CharacterAI資金斷裂，計(jì)劃賣身谷歌Meta；馬斯克自曝Grok-3用了10萬(wàn)塊H100丨AI情報(bào)局

曝微軟大牛童欣離職；CharacterAI資金斷裂，計(jì)劃賣身谷歌Meta；馬斯克自曝Grok-3用了10萬(wàn)塊H100丨AI情報(bào)局