0
本文作者: 我在思考中 | 2024-07-03 09:59 |
情報(bào)前線
微軟全球合伙人、微軟亞洲研究院首席研究員童欣離職:據(jù)悉,童欣于 1993 年和 1996 年獲得浙江大學(xué)本科和碩士學(xué)位,1999 年從清華大學(xué)博士畢業(yè)后加入微軟亞洲研究院。同時(shí)擔(dān)任中國(guó)科學(xué)技術(shù)大學(xué)兼職教授,博士生導(dǎo)師。童欣的主要研究方向是計(jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺。作為微軟亞洲研究院網(wǎng)絡(luò)圖形組首席研究員,他在微軟從事圖形學(xué)研究25 年。
融資快報(bào)
Character AI融資困難,計(jì)劃出售給谷歌和Meta:由谷歌前員工創(chuàng)立的AI獨(dú)角獸公司Character AI,曾因角色扮演聊天產(chǎn)品而備受矚目。盡管A16Z曾以10億美元估值投資1.5億美元,但隨著市場(chǎng)新鮮感消退和競(jìng)爭(zhēng)加劇,公司面臨融資困難,正考慮出售給谷歌或Meta,Character AI與這些科技巨頭探討了潛在合作,包括計(jì)算資源和知識(shí)產(chǎn)權(quán)共享。同時(shí),公司也在尋求新的收入來源,如廣告和API訪問,以維持增長(zhǎng)。
Zeroeyes獲5300萬(wàn)美元B輪融資:Zeroeyes是美國(guó)國(guó)土安全部指定的唯一人工智能驅(qū)動(dòng)的槍支檢測(cè)視頻分析平臺(tái)的開發(fā)者。索倫森資本牽頭的這一輪投資還包括英特爾資本、博德萊特資本和現(xiàn)有投資者。
Northern Data考慮將人工智能部門在美國(guó) IPO:總部位于德國(guó)的 Northern Data AG 正在考慮在美國(guó)進(jìn)行首次公開募股,以高達(dá) 160 億美元的估值出售其人工智能云計(jì)算和數(shù)據(jù)中心部門。該公司提供高性能計(jì)算基礎(chǔ)設(shè)施,并計(jì)劃最早于明年上半年,將由其云計(jì)算部門 Taiga 和數(shù)據(jù)中心組成的實(shí)體(名為 Ardent)在納斯達(dá)克證券交易所上市。
AI初創(chuàng)公司Abnormal Security估值將達(dá)50億美元:Abnormal Security利用人工智能檢測(cè)異常行為,防范商務(wù)電郵入侵等網(wǎng)絡(luò)安全威脅。此前,Abnormal Security已完成C輪融資2.1億美元,由Insight Partners領(lǐng)投,Greylock Partners 和Menlo Ventures跟投,當(dāng)時(shí)估值40億美元。
壹號(hào)智能完成天使輪融資:壹號(hào)智能是一家智能倉(cāng)儲(chǔ)機(jī)器人研發(fā)生產(chǎn)商,聚焦密集存儲(chǔ)細(xì)分賽道。本輪融資由合肥市新站區(qū)天使投資基金投資。
橋水啟動(dòng)由機(jī)器學(xué)習(xí)決策的20億美元規(guī)模基金:對(duì)沖基金巨頭橋水公司最新推出了一只由機(jī)器學(xué)習(xí)運(yùn)行并進(jìn)行決策的基金。據(jù)了解,該基金從不到10位客戶那里獲得了大約20億美元的資金。新投資工具由聯(lián)席首席投資官Greg Jensen牽頭,已開始交易。目前新基金依靠橋水公司研發(fā)了十多年的專有技術(shù),據(jù)知情人士透露,新基金還將擴(kuò)大范圍,納入OpenAI、Anthropic和Perplexity等公司開發(fā)的模型。
ETW獲得200萬(wàn)美元戰(zhàn)略投資:ETW是一家區(qū)塊鏈項(xiàng)目研發(fā)商,主要從事人工智能游戲技術(shù)研發(fā)、AI算法研發(fā)業(yè)務(wù),以提升游戲的智能化、個(gè)性化互動(dòng)以及游戲情節(jié)的深度和復(fù)雜度,從而為全球玩家?guī)砀鼮樯羁毯统两降挠螒蝮w驗(yàn)。ETW宣布獲哈佛大學(xué)的200萬(wàn)美元戰(zhàn)略投資。
(歡迎添加微信AIyanxishe2,了解更多AIGC、融資情況,與志同道合的朋友一同暢聊時(shí)新AI產(chǎn)品)
國(guó)內(nèi)情報(bào):
中國(guó)首款全尺寸人形機(jī)器人“青龍”將于 2024 世界人工智能大會(huì)亮相并開源:
大會(huì)現(xiàn)場(chǎng)將發(fā)布國(guó)內(nèi)首款全尺寸通用人形機(jī)器人開源公版機(jī)“青龍”和首個(gè)全尺寸人形機(jī)器人開源社區(qū) OpenLoong?!扒帻垺鄙砀?182 厘米,體重 82 公斤,全身多達(dá) 43 個(gè)主動(dòng)自由度,最大關(guān)節(jié)峰值扭矩 400 牛米,算力支持 400Tops。此外,特斯拉 Optimus 二代也將在 WAIC 2024 迎來首發(fā)。
月之暗面 Kimi 開放平臺(tái)“上下文緩存”開啟公測(cè):
該功能通過預(yù)先存儲(chǔ)頻繁請(qǐng)求的數(shù)據(jù),可以在不增加 API 價(jià)格的情況下,降低最高 90% 的長(zhǎng)文本大模型使用成本,并提升模型響應(yīng)速度,首 Token 延遲降低 83%。
適用場(chǎng)景包括 QA Bot、文檔集合查詢、靜態(tài)代碼庫(kù)或知識(shí)庫(kù)分析、爆款 AI 應(yīng)用以及 Agent 類應(yīng)用等。計(jì)費(fèi)方式主要分為 Cache 創(chuàng)建費(fèi)用、Cache 存儲(chǔ)費(fèi)用和 Cache 調(diào)用費(fèi)用。公測(cè)期間,該功能首先開放給 Tier5 等級(jí)用戶,其他用戶的開放時(shí)間待定。
優(yōu)必選與一汽-大眾達(dá)成合作,打造“人形機(jī)器人”超級(jí)無人汽車工廠:
一汽-大眾將向優(yōu)必選開放其位于青島的“國(guó)家級(jí)智能制造示范工廠”生產(chǎn)線應(yīng)用場(chǎng)景,引入工業(yè)版人形機(jī)器人 Walker S 開展汽車制造過程中的螺栓擰緊、零件安裝、零件轉(zhuǎn)運(yùn)等工作。此前,優(yōu)必選工業(yè)版人形機(jī)器人 Walker S 已進(jìn)入蔚來第二先進(jìn)制造基地總裝車間、東風(fēng)柳汽總裝車間等多家車廠。
阿里媽媽獲國(guó)際計(jì)算機(jī)大會(huì)比賽主辦權(quán):
阿里媽媽基于入選國(guó)際計(jì)算機(jī)大會(huì)NeurIPS 2024的“大規(guī)模拍賣中的自動(dòng)出價(jià)”賽題,正式啟動(dòng)全球范圍的參賽選手征集。此賽題出自北大-阿里媽媽人工智能創(chuàng)新聯(lián)合實(shí)驗(yàn)室。同時(shí),阿里媽媽獲得NeurIPS比賽主辦權(quán)。據(jù)了解,北大-阿里媽媽人工智能創(chuàng)新聯(lián)合實(shí)驗(yàn)室是北京大學(xué)聯(lián)合阿里媽媽共建的校企聯(lián)合研發(fā)平臺(tái),重點(diǎn)研究方向包括決策智能、大規(guī)模圖預(yù)訓(xùn)練模型、智能音樂生成等。
2B大模型戰(zhàn)勝20B,國(guó)產(chǎn)新框架高效處理視覺任務(wù):
Prism 框架是上海 AI Lab、南京大學(xué)、香港中文大學(xué)等共同開發(fā)的一種專門針對(duì)視覺語(yǔ)言任務(wù)的兩階段框架。它將 VLM 的感知和推理能力顯式解耦,在感知階段,VLM 負(fù)責(zé)提取圖像視覺信息并以文本形式輸出;在推理階段,ChatGPT 等大型語(yǔ)言模型根據(jù) VLM 提供的文本信息和輸入文本生成回復(fù)。這種分離的方法提高了處理視覺語(yǔ)言任務(wù)的效率,使得 2B VLM 與 ChatGPT 的組合能夠達(dá)到相當(dāng)于 10 倍參數(shù)量 VLM 的性能。
姚班大神陳立杰獲UC伯克利教職,2025年秋季入職:
陳立杰將于 2025 年秋季任加州大學(xué)伯克利分校 EECS 助理教授。他 1995 年出生,是清華大學(xué)姚班知名校友,2016 年清華特等獎(jiǎng)學(xué)金得主,也是首位在 FOCS 上發(fā)表論文的中國(guó)本科生。
更多國(guó)內(nèi)情報(bào):
騰訊搜狗輸入法上線AI 幫寫、AI 對(duì)話、快捷問答、AI 寵物和 AI 自拍表情等功能:此次 AI 升級(jí)使輸入法從簡(jiǎn)單輸入向智能輔助轉(zhuǎn)變,改變輸入法的互動(dòng)方式,提供內(nèi)容創(chuàng)作、信息查詢和娛樂互動(dòng)等多方面服務(wù)。
騰訊云推出星脈網(wǎng)絡(luò)2.0 大模型訓(xùn)練再提速20%:通過升級(jí)硬件和軟件,提高大模型訓(xùn)練的效率,具體包括支持更大規(guī)模的集群網(wǎng)絡(luò)、提升通信協(xié)議性能、優(yōu)化集合通信庫(kù),以及引入靈境仿真平臺(tái)。
網(wǎng)易有道推出有道詞典筆X7:該產(chǎn)品內(nèi)置AI攝像頭,并搭載國(guó)內(nèi)首個(gè)教育大模型“子曰”的兩款應(yīng)用功能,AI全科家庭教師小P老師、虛擬人口語(yǔ)私教Hi Echo。
聯(lián)合國(guó)大會(huì)通過中國(guó)提出的加強(qiáng)人工智能能力建設(shè)國(guó)際合作決議:140 多國(guó)聯(lián)署決議,強(qiáng)調(diào)人工智能發(fā)展應(yīng)堅(jiān)持以人為本、造福人類等原則,鼓勵(lì)國(guó)際合作,幫助發(fā)展中國(guó)家加強(qiáng)人工智能能力建設(shè)。
四部門印發(fā)《國(guó)家人工智能產(chǎn)業(yè)綜合標(biāo)準(zhǔn)化體系建設(shè)指南(2024版)》:到 2026 年,計(jì)劃通過提高標(biāo)準(zhǔn)與產(chǎn)業(yè)科技創(chuàng)新的聯(lián)動(dòng)水平,新制定 50 多項(xiàng)國(guó)家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn),推動(dòng)人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展,這是中國(guó)在人工智能領(lǐng)域標(biāo)準(zhǔn)化方面的重大布局。
國(guó)際情報(bào):
蘋果發(fā)布 AI 大模型 4M:
蘋果與瑞士聯(lián)邦理工學(xué)院洛桑分校合作,在 Hugging Face Spaces 平臺(tái)推出4M AI 模型的公開演示版。距離該模型首次開源已有七個(gè)月,4M 演示版能夠處理和生成包括圖像、文本和 3D 場(chǎng)景在內(nèi)的多種模態(tài)內(nèi)容,用戶可以通過文本描述生成圖像,進(jìn)行物體識(shí)別,甚至使用自然語(yǔ)言操控 3D 場(chǎng)景。
TikTok開發(fā)新AI聊天Genie,已申請(qǐng)商標(biāo),服務(wù)海外用戶:
Genie 商標(biāo)已在美國(guó)申請(qǐng),預(yù)計(jì)該聊天機(jī)器人將允許用戶在直播中提出問題并獲得即時(shí)答復(fù)等功能,集成了 TikTok 的多種 AI 元素,包括生成式人工智能搜索功能,該功能已在抖音中文版推出,并且正在開發(fā) AI 音樂生成、文本轉(zhuǎn)視頻創(chuàng)建等工具。此外,TikTok 還在開發(fā) StreamVoice 系統(tǒng),該系統(tǒng)能夠模擬人的聲音,以及虛擬人直播功能。
ECCV 2024錄用率或創(chuàng)新低,2395篇論文中選:
ECC2024 錄用 2395 篇論文,提交量約 12600 篇,錄用率 18%創(chuàng)新低。作為對(duì)比,CVPR 2024 錄用率 23.6%,ECCV 2022 錄用率 28%。
RunwayGen-3向所有人開放,媲美Sora:
Gen-3 目前每次只能生成 11 秒 720P 視頻且無背景音樂,沒有免費(fèi)試用,每月至少 12 美元。Runway 的 Gen-2 及其他產(chǎn)品免費(fèi),另外Gen-3會(huì)提供運(yùn)動(dòng)畫筆、相機(jī)控制、導(dǎo)演模式等高級(jí)功能,幫助用戶制作更精良的視頻。
英偉達(dá)發(fā)布直播神器NVIDIA Broadcast,加點(diǎn)AI提升直播質(zhì)量:
NVIDIA Broadcast 是專為 RTX GPU 用戶設(shè)計(jì)的應(yīng)用程序,具有噪音和回聲去除、虛擬背景、自動(dòng)對(duì)焦、視頻噪點(diǎn)去除和眼神接觸等功能,支持多種應(yīng)用程序,如 Discord、Google Meet、Microsoft Teams 等,能提供專業(yè)和創(chuàng)意的直播體驗(yàn)。
Anthropic推出新計(jì)劃,資助新一代AI基準(zhǔn)測(cè)試的開發(fā):
該計(jì)劃鼓勵(lì)開發(fā)者參與基準(zhǔn)測(cè)試評(píng)估工作,旨在提升 AI 安全領(lǐng)域水平,為研究人員提供工具。Anthropic 認(rèn)為目前 AI 基準(zhǔn)測(cè)試無法反映實(shí)際情況,呼吁對(duì)模型進(jìn)行網(wǎng)絡(luò)攻擊、增強(qiáng)大規(guī)模殺傷性武器能力以及操縱或欺騙人們的能力測(cè)試。
全球首個(gè)神經(jīng)連接機(jī)械腿,截肢者恢復(fù)自然行走:
麻省理工學(xué)院研究團(tuán)隊(duì)開發(fā)出一種新型機(jī)械腿,通過神經(jīng)接口和興奮劑 - 拮抗劑肌神經(jīng)接口的手術(shù)方法,使膝蓋以下截肢患者能夠通過自身神經(jīng)信號(hào)控制機(jī)械腿的運(yùn)動(dòng),恢復(fù)自然的步態(tài)和肢體在空間中的位置感。
OpenAI CEO 奧特曼稱GPT-5 將帶來“巨大飛躍”:
奧特曼表示開發(fā)GPT-5還需要一些時(shí)間,并表示它將是“巨大飛躍(significant leap forward)”。此前,奧特曼曾公開表示 GPT-4 “有些糟糕”,并委婉地稱之為“充其量只是有點(diǎn)尷尬”。
奧特曼解釋說:“我希望它能取得重大飛躍。GPT-4 經(jīng)常犯很多錯(cuò)誤,比如在推理方面表現(xiàn)不佳,有時(shí)還會(huì)完全跑偏,犯下低級(jí)錯(cuò)誤,就像連一個(gè)六歲孩子都不會(huì)犯的一樣。”奧特曼關(guān)于 GPT-5 的言論暗示,這個(gè)模型可能仍處于早期開發(fā)階段。這可能歸因于復(fù)雜算法、數(shù)據(jù)問題以及 GPT-5 本身龐大的體量。
價(jià)值近300億,馬斯克稱訓(xùn)練Grok-3用了10萬(wàn)塊英偉達(dá)H100:
馬斯克表示,訓(xùn)練 AI 聊天機(jī)器人需要數(shù)據(jù)集,而且從現(xiàn)有數(shù)據(jù)中清除大型語(yǔ)言模型的工作量很大。他還談到了 OpenAI 模型輸出訓(xùn)練的幾個(gè)問題。他透露 xAI 的 Grok-3 用了 10 萬(wàn)塊英偉達(dá) H100 芯片進(jìn)行訓(xùn)練,預(yù)計(jì)將于年底發(fā)布,相信它會(huì)“非常特別”。
比爾·蓋茨稱Scaling Law快要走到盡頭,超人AI還需新的突破:
比爾·蓋茨討論了人工智能的發(fā)展,強(qiáng)調(diào)其在醫(yī)療、教育和生產(chǎn)力中的重要性。他認(rèn)為 AI 將影響合成生物學(xué)和機(jī)器人技術(shù),并預(yù)測(cè)個(gè)人智能體會(huì)通過耳機(jī)、眼鏡等設(shè)備與人類交互。蓋茨指出,AI 的真正進(jìn)步在于實(shí)現(xiàn)更接近人類的元認(rèn)知能力,而非僅擴(kuò)大模型規(guī)模。他預(yù)期 AI 將提升生產(chǎn)率并改善生活質(zhì)量,但也提醒需警惕技術(shù)發(fā)展對(duì)社會(huì)的影響。
更多國(guó)際情報(bào):
Adobe發(fā)布全新改進(jìn)的Content Hub,具備生成式AI功能:該平臺(tái)集成了 Adobe Experience Manager Assets,旨在幫助企業(yè)高效管理數(shù)字資產(chǎn),優(yōu)化內(nèi)容供應(yīng)鏈,并提升營(yíng)銷活動(dòng)和數(shù)字體驗(yàn)的創(chuàng)建。
全球首例,法國(guó)反壟斷機(jī)構(gòu)準(zhǔn)備對(duì)英偉達(dá)出手:違反反壟斷法的公司可能面臨高達(dá)其全球年?duì)I業(yè)額10%的罰款,以英偉達(dá)2024財(cái)年609億美元的營(yíng)收來計(jì)算,罰款金額最高可達(dá)60.9億美元。
遭攝影師投訴后,Instagram將“Made with AI”標(biāo)簽換成“AI info”:此前用戶僅使用Adobe的裁剪工具和拼合圖像就會(huì)觸發(fā)該標(biāo)簽。
YouTube 允許用戶請(qǐng)求刪除模擬的面部或聲音的 AI 生成內(nèi)容:受影響的個(gè)人可以基于隱私侵犯理由,通過YouTube的隱私請(qǐng)求流程要求刪除AI生成的內(nèi)容。
AWS承諾投入5000萬(wàn)美元支持公共部門生成式AI創(chuàng)新:旨在通過提供云信用和先進(jìn)的 AI 基礎(chǔ)設(shè)施,加速公共部門在生成式 AI 領(lǐng)域的創(chuàng)新。這個(gè)計(jì)劃預(yù)計(jì)將持續(xù)兩年,并提供對(duì) AWS 服務(wù)的訪問權(quán)限。
到2027年,Deepfakes帶來的損失將達(dá)到400億美元:復(fù)合年增長(zhǎng)率將達(dá)到驚人的32%。預(yù)計(jì)到2024年,此類事件將增加50%至60%,全球?qū)⒂?40000-150000起此類事件。德勤預(yù)計(jì),銀行和金融服務(wù)將成為主要目標(biāo)。
Product Hunt 熱榜,智能摘要工具Briefy.AI
Briefy是一款創(chuàng)新的人工智能摘要工具,能夠?qū)⒏鞣N長(zhǎng)篇內(nèi)容快速轉(zhuǎn)換成結(jié)構(gòu)化摘要。這款工具支持文章、視頻、郵件和播客等多種內(nèi)容類型,并提供概覽、表格、思維導(dǎo)圖等多種視圖展示方式。用戶可以在個(gè)人知識(shí)庫(kù)中方便地管理和回顧這些摘要,還能使用自然語(yǔ)言搜索快速找到所需信息。
Briefy的多語(yǔ)言支持和全設(shè)備兼容性使其成為學(xué)生、專業(yè)人士和內(nèi)容創(chuàng)作者的理想選擇。用戶反饋顯示,Briefy極大地提高了閱讀效率,并在理解復(fù)雜主題時(shí)提供了顯著幫助。
?https://briefy.ai/?ref=producthunt
GitHub Trending 熱榜,增強(qiáng)人類能力的開源框架 AI助手Fabric
Fabric是一個(gè)創(chuàng)新的開源框架,旨在通過AI技術(shù)放大人類創(chuàng)造力。一個(gè)為了解決特定問題而提供的模塊化框架,通過一個(gè)由人群源提供的 AI 提示集來實(shí)現(xiàn),這些提示可以在任何地方使用,包括可選的服務(wù)器(Mill)、AI使用案例(Patterns)和客戶端應(yīng)用(Looms),讓用戶能輕松應(yīng)用AI解決特定問題。
這個(gè)命令行原生的工具支持自定義模式和輔助應(yīng)用,使用簡(jiǎn)單yet功能強(qiáng)大。未來,F(xiàn)abric計(jì)劃轉(zhuǎn)向Go語(yǔ)言,以提供更流暢的用戶體驗(yàn)。無論是分析YouTube視頻還是處理復(fù)雜數(shù)據(jù),F(xiàn)abric都為AI輔助人類工作開辟了新途徑。
?https://danielmiessler.com/p/fabric-origin-story
開發(fā)者推薦,AI 賦能郵件管理新工具 Superhuman 2.0
Superhuman公司最近發(fā)布了其電子郵件管理工具的2.0版本,旨在通過人工智能和一系列高級(jí)功能提升用戶處理郵件的效率。該工具針對(duì)使用Gmail或Outlook的團(tuán)隊(duì)設(shè)計(jì),聲稱能幫助用戶以兩倍于以往的速度處理郵件,每年為團(tuán)隊(duì)節(jié)省超過1000萬(wàn)小時(shí)。
Superhuman 2.0整合了多項(xiàng)功能,包括AI輔助寫作、智能收件箱分類、自動(dòng)跟進(jìn)提醒等。用戶反饋表明,這些功能有助于加快決策速度,提供更高質(zhì)量的回復(fù),并讓團(tuán)隊(duì)成員更專注于重要工作。然而,具體效果可能因個(gè)人使用習(xí)慣和團(tuán)隊(duì)需求而異。
?https://superhuman.com/?ref=producthunt
前沿技術(shù)
1.北大港科大聯(lián)手推進(jìn)醫(yī)療AI:模型性能達(dá)GPT-4水平
北京大學(xué)和香港科技大學(xué)的研究團(tuán)隊(duì)最近在醫(yī)療人工智能領(lǐng)域取得重大進(jìn)展。他們提出了一種新的醫(yī)療專家模型訓(xùn)練方法,成功將8B規(guī)模的模型性能提升至接近GPT-4的水平。研究中引入的"穩(wěn)定性差距"概念有效解決了大語(yǔ)言模型持續(xù)預(yù)訓(xùn)練中的問題。
該團(tuán)隊(duì)通過優(yōu)化訓(xùn)練策略,在醫(yī)療領(lǐng)域?qū)崿F(xiàn)了顯著效果,同時(shí)大幅減少了計(jì)算資源消耗。這項(xiàng)研究成果已在HuggingFace平臺(tái)上開源,為醫(yī)療AI的發(fā)展提供了新的可能性。這一突破展示了大語(yǔ)言模型在特定領(lǐng)域應(yīng)用的潛力,可能對(duì)未來醫(yī)療實(shí)踐產(chǎn)生深遠(yuǎn)影響。
?https://arxiv.org/abs/2406.14833
2.MotionClone:無需訓(xùn)練的動(dòng)作克隆技術(shù)引領(lǐng)視頻生成新時(shí)代
中國(guó)科學(xué)技術(shù)大學(xué)、上海交通大學(xué)等多所高校的研究團(tuán)隊(duì)近日提出了一種名為MotionClone的創(chuàng)新視頻生成框架。這項(xiàng)技術(shù)突破性地實(shí)現(xiàn)了無需訓(xùn)練的動(dòng)作克隆,能夠從參考視頻中提取動(dòng)作,并通過時(shí)序注意力指導(dǎo)和位置感知語(yǔ)義指導(dǎo)兩大核心組件,對(duì)文本到視頻的生成過程進(jìn)行全面控制。
MotionClone的出現(xiàn)解決了傳統(tǒng)方法在跨領(lǐng)域應(yīng)用時(shí)可能出現(xiàn)的動(dòng)作生成問題,同時(shí)提升了生成模型對(duì)空間關(guān)系的合成能力和對(duì)提示的遵循程度。這一突破性成果不僅展示了AI在視頻生成領(lǐng)域的巨大潛力,也為未來的創(chuàng)意產(chǎn)業(yè)和內(nèi)容創(chuàng)作開辟了新的可能性。
?https://bujiazi.github.io/motionclone.github.io/
3.MimicMotion:騰訊聯(lián)手上交大打造新一代人體動(dòng)作視頻生成器
騰訊與上海交通大學(xué)的研究團(tuán)隊(duì)近日推出了名為MimicMotion的創(chuàng)新人體運(yùn)動(dòng)視頻生成框架。這一突破性技術(shù)旨在生成任意長(zhǎng)度的高質(zhì)量視頻,通過融合圖像到視頻擴(kuò)散模型和引入置信度感知的姿態(tài)指導(dǎo),顯著提升了生成視頻的時(shí)間一致性和細(xì)節(jié)豐富度。
MimicMotion在多個(gè)方面超越了現(xiàn)有技術(shù),尤其在手部細(xì)節(jié)生成和長(zhǎng)視頻平滑過渡方面表現(xiàn)卓越。研究團(tuán)隊(duì)通過大量實(shí)驗(yàn)和用戶研究,證實(shí)了該框架在視頻質(zhì)量、時(shí)間一致性和對(duì)參考姿態(tài)的準(zhǔn)確遵循等方面的優(yōu)勢(shì)。這一成果不僅推動(dòng)了AI視頻生成技術(shù)的進(jìn)步,也為未來虛擬內(nèi)容創(chuàng)作和數(shù)字娛樂產(chǎn)業(yè)開辟了新的可能性。
?https://tencent.github.io/MimicMotion/
4.Mobile-Agent-v2: 通過多代理協(xié)作有效導(dǎo)航的移動(dòng)設(shè)備操作助手
Mobile-Agent-v2 是由北京交通大學(xué)和阿里巴巴集團(tuán)聯(lián)合開發(fā)的一個(gè)移動(dòng)設(shè)備操作助手,它旨在通過多代理協(xié)作解決長(zhǎng)上下文圖文交錯(cuò)輸入中的導(dǎo)航問題。該系統(tǒng)采用了增強(qiáng)的視覺感知模塊以及 GPT-4o 技術(shù),以提高操作的準(zhǔn)確率和效率。目前,Mobile-Agent-v2 支持的系統(tǒng)有安卓和鴻蒙(版本號(hào)小于等于 4),而 iOS 系統(tǒng)暫時(shí)不支持。使用前需要安裝依賴、通過 ADB 連接移動(dòng)設(shè)備、安裝 ADB 鍵盤,并配置 run.py 文件中的設(shè)置,包括 ADB 路徑、指令、GPT-4 API URL 和 Token。用戶可以根據(jù)自己的設(shè)備性能選擇本地部署圖標(biāo)描述模型還是通過 API 調(diào)用方式,并可以根據(jù)需要添加操作知識(shí)以提高準(zhǔn)確性。此外,通過調(diào)整 “反思智能體” 和 “內(nèi)存單元” 的開關(guān),可以進(jìn)一步提升移動(dòng)設(shè)備的效率。
?https://github.com/X-PLUG/MobileAgent
5.騰訊推出革命性多智能體翻譯工具TransAgents,免費(fèi)試用中!
騰訊最新推出的TransAgents翻譯工具,這款基于GPT-4的多智能體協(xié)作系統(tǒng)不僅能高質(zhì)量翻譯網(wǎng)絡(luò)文學(xué),更開放免費(fèi)在線試用。只需上傳txt或pdf文件,TransAgents就能為你呈現(xiàn)專業(yè)級(jí)翻譯。
TransAgents采用創(chuàng)新的多Agent協(xié)作模式,涵蓋翻譯、文化適應(yīng)、校對(duì)等全方位服務(wù)。已成功翻譯20本網(wǎng)文,獲得讀者青睞。無論你是文學(xué)愛好者還是專業(yè)譯者,都不容錯(cuò)過這次AI翻譯!
? http://transagents.ai
大牛洞見
AI革命:從數(shù)字物種到信息處理巨人
Mustafa Suleyman,微軟 AI 首席執(zhí)行官,也是當(dāng)前許多人使用的 AI 模型之一的主要建造者,在 TED2024 大會(huì)上發(fā)表演講,探討了人工智能的本質(zhì)問題。他指出,即使是 AI 領(lǐng)域的專家也在努力描述這一技術(shù)的未來方向。Suleyman 提供了一個(gè)新的數(shù)字物種隱喻,旨在將注意力集中在人工智能領(lǐng)域的這一關(guān)鍵時(shí)刻。他的演講后續(xù)還包括了與 TED 首席執(zhí)行官 Chris Anderson 的問答環(huán)節(jié)。演講內(nèi)容涵蓋了技術(shù)、計(jì)算機(jī)、創(chuàng)新、未來、人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域。此外,還引發(fā)Reddit用戶的熱烈討論,
展示AI驚人的數(shù)據(jù)處理能力:月訓(xùn)練量達(dá)8萬(wàn)億字
專家和網(wǎng)友都在努力理解AI的本質(zhì)和未來方向
AI學(xué)習(xí)效率vs人類:缺乏感知能力,但數(shù)據(jù)處理量巨大
警惕AI"幻覺"問題,強(qiáng)調(diào)人為核實(shí)的重要性
AI數(shù)據(jù)收集引發(fā)倫理思考
? https://www.ted.com/talks/mustafa_suleyman_what_is_an_ai_anyway?language=en&subtitle=en
敬請(qǐng)期待明日的最新動(dòng)態(tài)!
AI情報(bào)局征集情報(bào)合伙人,匯集獨(dú)家價(jià)值線索!如果您可以提供有關(guān)AI最新成果&行業(yè)內(nèi)幕&獨(dú)特產(chǎn)品,請(qǐng)?zhí)砑舆\(yùn)營(yíng)微信號(hào):AIyanxishe2備注行業(yè)崗位。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。