0
本文作者: Nemo | 2025-03-11 17:03 |
DeepSeek爆火背后,底層數(shù)字技術(shù)也在求索與AI的深度結(jié)合。
3月7日,清華大學(xué)、騰訊云、intel在北京宣布啟動(dòng)“數(shù)據(jù)庫(kù)AI聯(lián)合創(chuàng)新計(jì)劃”,圍繞數(shù)據(jù)庫(kù)與大模型的交叉技術(shù)展開深度研究,推動(dòng)數(shù)據(jù)庫(kù)智能化升級(jí),同時(shí)為AI應(yīng)用構(gòu)建高效數(shù)據(jù)基礎(chǔ)設(shè)施。
這也是國(guó)內(nèi)首個(gè)數(shù)據(jù)庫(kù)AI領(lǐng)域的產(chǎn)學(xué)研聯(lián)動(dòng)項(xiàng)目。
(圖:清華大學(xué)、騰訊云、intel聯(lián)合啟動(dòng)“數(shù)據(jù)庫(kù)AI聯(lián)合創(chuàng)新計(jì)劃”)
隨著大語言模型技術(shù)爆發(fā),數(shù)據(jù)庫(kù)系統(tǒng)面臨從“被動(dòng)存儲(chǔ)”向“主動(dòng)服務(wù)”轉(zhuǎn)型的挑戰(zhàn)。傳統(tǒng)數(shù)據(jù)庫(kù)依賴人工編寫復(fù)雜查詢語句,而大模型的自然語言交互能力可大幅降低使用門檻;另一方面,AI訓(xùn)練與推理所需的海量數(shù)據(jù)處理,也亟需數(shù)據(jù)庫(kù)在分布式架構(gòu)、緩存管理等環(huán)節(jié)實(shí)現(xiàn)性能躍升。
針對(duì)這一趨勢(shì),本次合作規(guī)劃了兩大技術(shù)攻堅(jiān)路徑:一方面研發(fā)基于大模型的智能查詢生成與優(yōu)化系統(tǒng)(Text2SQL),讓用戶通過自然語言直接操作數(shù)據(jù)庫(kù),實(shí)現(xiàn)艱深的數(shù)據(jù)庫(kù)技術(shù)也能聽懂“人話”;另一方面打造面向大模型推理的分布式緩存產(chǎn)品,解決AI任務(wù)調(diào)度、存儲(chǔ)資源分配等核心難題。
在Text2SQL方向,項(xiàng)目組提出端到端技術(shù)框架,重點(diǎn)突破語義理解、模式匹配、SQL驗(yàn)證等關(guān)鍵環(huán)節(jié)。通過大模型微調(diào)、強(qiáng)化學(xué)習(xí)(DPO)與檢索增強(qiáng)(RAG)技術(shù),系統(tǒng)可將用戶提問拆解為多級(jí)子任務(wù),并動(dòng)態(tài)匹配數(shù)據(jù)庫(kù)表結(jié)構(gòu),最終生成高準(zhǔn)確率SQL語句。
面向大模型推理加速,項(xiàng)目組設(shè)計(jì)了分布式緩存系統(tǒng),通過兩階段任務(wù)調(diào)度、KVCache優(yōu)化及GPU直連存儲(chǔ)技術(shù),顯著降低計(jì)算資源浪費(fèi)。
作為合作的重要支撐,騰訊云在數(shù)據(jù)庫(kù)AI領(lǐng)域已有不少積淀。據(jù)騰訊云數(shù)據(jù)庫(kù)副總經(jīng)理羅云透露,騰訊云數(shù)據(jù)庫(kù)以AI for DB和DB for AI作為技術(shù)發(fā)展的戰(zhàn)略方向,在多產(chǎn)品中已集成自適應(yīng)運(yùn)維與故障診斷、數(shù)據(jù)庫(kù)智能優(yōu)化、自然語言驅(qū)動(dòng)數(shù)據(jù)分析等能力,同時(shí)依托騰訊云向量數(shù)據(jù)庫(kù)千億級(jí)向量規(guī)模和500萬 QPS 峰值能力,為3000多家企業(yè)構(gòu)建了AI時(shí)代的數(shù)據(jù)樞紐。
此次合作也凸顯了“產(chǎn)學(xué)研”深度融合的創(chuàng)新模式。清華大學(xué)數(shù)據(jù)庫(kù)科研組在學(xué)術(shù)領(lǐng)域連續(xù)多年位列 CSRankings 全球第一,騰訊云則擁有業(yè)界領(lǐng)先的工程落地能力。雙方合作將加速技術(shù)研究從實(shí)驗(yàn)室到企業(yè)生產(chǎn)環(huán)境的進(jìn)度。
清華大學(xué)數(shù)據(jù)庫(kù)科研組表示:“未來的數(shù)據(jù)庫(kù)不僅是存儲(chǔ)工具,更是 AI 產(chǎn)業(yè)鏈的數(shù)據(jù)大腦。我們期待通過這次合作,為全球數(shù)據(jù)庫(kù)技術(shù)發(fā)展提供中國(guó)方案?!?/p>
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。