丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
AI+ 正文
發(fā)私信給王悅
發(fā)送

0

對話丨ChatLaw 團隊袁粒:做普通人也能用的法律大模型

本文作者: 王悅 2023-07-31 12:32
導(dǎo)語:“只有被應(yīng)用到實際生活里,科學(xué)技術(shù)才能產(chǎn)生價值?!?

作者丨王悅

編輯丨董子博

大模型賽道的競逐進行到6月,AI 行業(yè)的共識正發(fā)生著迅速而激烈的變化。

從開始對泛用大模型的追求,到對更具落地能力的行業(yè)模型,越來越多的從業(yè)者開始發(fā)現(xiàn),如果無法實打?qū)嵉爻蔀樯a(chǎn)力,那么無論是“大模型”還是“AGI”,都不過只是一個被炒熱炒紅的概念。

“只有被應(yīng)用到實際生活里,科學(xué)技術(shù)才能產(chǎn)生價值。”如此堅信著,北京大學(xué)信息工程學(xué)院助理教授、博士生導(dǎo)師袁粒一門心思,撲在了大模型的應(yīng)用層開發(fā)上。

今年早些時候,袁粒便帶領(lǐng)團隊開發(fā)了一款名為“ChatExcel”的產(chǎn)品,意圖利用大模型技術(shù),來幫助用戶更高效地完成圖表工作,一時間獲得了不少好評。

而今天,袁粒和團隊又推出了一個新的項目——“ChatLaw”。應(yīng)用大模型技術(shù),ChatLaw 可以幫助對法律知之甚少的普通人,讓他們能夠獲得一些初步的法律建議,并且還能夠進一步地幫助他們,完成分析證據(jù)、起草訴狀、尋找法律援助中心等工作。

“ChatLaw 可以讓老百姓獲得專業(yè)法律幫助之前,完成律師30-40%的工作?!痹?AI 科技評論表示道。

作為國內(nèi)首個法律場景下的落地大語言模型產(chǎn)品,袁粒帶領(lǐng)課題組和北京大學(xué)-兔展AIGC聯(lián)合實驗室,完成了不少工作。

一方面,袁粒和團隊收集了大量的公開數(shù)據(jù)——如法律法條、判例、司法解釋等,又通過北京大學(xué)的平臺,在北大國際法學(xué)院和相關(guān)的律所收集到了不少私有數(shù)據(jù),以及一個比較完備的知識圖譜,形成了一套專業(yè)的數(shù)據(jù)庫,讓 ChatLaw 在法律領(lǐng)域,具有對場景的更好理解能力;

另一方面,大模型常常會“一本正經(jīng)地胡說八道”,尤其是在專業(yè)領(lǐng)域,常常給出失之毫厘,差之千里的結(jié)果。為了最大程度上解決困擾大模型的“幻覺”問題,讓 AI 能在法律領(lǐng)域保證輸出的正確性,ChatLaw 并不是單個大模型“一人成軍”,而是由四個分管不同能力的大模型“強強聯(lián)合”,針對不同的專業(yè)法律領(lǐng)域,完成更高質(zhì)量的生成輸出。

在 ChatLaw 的實際測試中,袁粒說,單看法條輸出的正確率,已經(jīng)可以達到80%-90%,偶有錯漏;而就給出的法律建議而言,也能達到60%以上的滿意度——相較其他大模型產(chǎn)品高出不少。

ChatLaw 在今日已經(jīng)開啟了邀請制的內(nèi)測,乘這個機會,AI 科技評論和袁粒進行了一場對談,對有關(guān) ChatLaw 和當(dāng)下大模型產(chǎn)品的技術(shù)判斷,討論了許多先進的認(rèn)知。

以下是 AI 科技評論與袁粒的對談實錄,雷峰網(wǎng)(公眾號:雷峰網(wǎng))在不改變原意的情況下做了編輯和調(diào)整:


專業(yè)數(shù)據(jù)+知識圖譜

讓 ChatLaw 變成最專業(yè)的法律大模型


AI科技評論:專業(yè)數(shù)據(jù)對于大模型的垂直領(lǐng)域場景理解至關(guān)重要,ChatLaw 在數(shù)據(jù)收集的角度,做了哪些努力?

袁粒:法律領(lǐng)域相較其他比較特殊——很多最高質(zhì)量的數(shù)據(jù),都是公開數(shù)據(jù)。這其中就包括法律法規(guī)、判例文書、司法解釋等等。我們的數(shù)據(jù)處理,主要就是基于這些公開的數(shù)據(jù)。

同時,我們也獲得了一部分比較有價值的私有數(shù)據(jù)。這部分?jǐn)?shù)據(jù),主要是北大國際法學(xué)院,以及這個部分的行業(yè)律師事務(wù)所,提供給我們的私有數(shù)據(jù)。不僅如此,他們也對我們的數(shù)據(jù)集進行了一個專業(yè)的加持——具體而言,就是把這些數(shù)據(jù)集中,再將不行的部分刪去。

但總體上,我們最大規(guī)模的數(shù)據(jù)集還是以法律法規(guī)為基礎(chǔ)的公開數(shù)據(jù)。

AI 科技評論:具體而言,法律場景會用到的數(shù)據(jù)有什么特殊性?

袁粒:首先,我們認(rèn)為法律法條其實是個有限子集,因為條文是有限的。而事實情況,則可能是會多種多樣的。

在這樣的情況下,用事實來帶入法條,這些處理都是有跡可循的。所以,我們是以案例去構(gòu)建了整個數(shù)據(jù)的核心,而不是單純以法條或事件。

除了案例之外,我們還有幾套支柱。對于每個案例,我們基于同案同判的原則,對每一種具體的 case 都會有一個律師的標(biāo)注。

這也是我們數(shù)據(jù)集非常重要的一個環(huán)節(jié),因為它包含了人的專業(yè)性在里面,在事實判例和法律之間完成了一個連接。

通過這個圖譜,我們可以去對各種各樣的法律的案例進行回答;并且也能讓模型知道,什么是對的回答,這個非常重要。


“四合一”的架構(gòu)

讓“幻覺”更少出現(xiàn)

AI 科技評論:法律作為一個相當(dāng)嚴(yán)肅的場景,和醫(yī)療、金融區(qū)別在哪里?

袁粒:法律這個行業(yè),跟金融、醫(yī)療場景有一個比較大的區(qū)別——它的流程是非常程序化和標(biāo)準(zhǔn)化的。實際上 ChatLaw 去模擬的,就是一個法院、或者說律師,通過理解用戶的事實,然后對他的事實提出對應(yīng)的法條,然后最終做出整套的判斷。

實際上在這套流程中有三個步驟:

歸納事實;

從事實推理到法條;

依據(jù)上面的結(jié)果,發(fā)現(xiàn)爭議焦點,進行完整的推理,給出法律建議。

我們的 ChatLaw 雖然是大模型產(chǎn)品,但實際上包了四個模型,但其中放在 GitHub 上開源的只有一個模型。

AI 科技評論:這四個模型分別有什么功能?他們之間是如何協(xié)作的?

袁粒:四個模型中,第一個模型是調(diào)動模型,負(fù)責(zé)理解用戶的這個語義,再來依據(jù)事實,來調(diào)度特定的子模型。

余下的三個模型,主要功能是從事實歸納出法律,或者說,法律加爭議交鋒點去做推理。

對這三個模型,我們在訓(xùn)練的過程中,關(guān)鍵是在訓(xùn)練階段將對應(yīng)這個模型專有和特定的知識,在模型里面去大量地輸入,再去做特殊處理和強化學(xué)習(xí)。

那么這樣,我們確保模型在一個單獨的場景下,它具有非常高的推理能力,這三個模型就能針對專有的問題,完成高質(zhì)量的輸出。

AI 科技評論:1+3的這個模式相當(dāng)新穎,并且聽起來也更能應(yīng)對專業(yè)領(lǐng)域的問題。這個模式,會成為以后行業(yè)大模型的新趨勢嗎?

袁粒:這里面有兩個問題。

第一個問題,就是法律場景有它的特殊性。法律是一個非常流程化的場景,但是如果遷移到一個別的領(lǐng)域——比如說教育——它可能就不是這樣了。

我認(rèn)為,可能只會有兩到三個特定領(lǐng)域的場景,它會可以使用這種方法,其他的場景應(yīng)用起來,提升效果可能不會這么大。

第二個問題,是它的投入產(chǎn)出比可能會比較小,因為 ChatLaw 的模式,相當(dāng)于為一個產(chǎn)品訓(xùn)練了三個模型。

AI 科技評論:在 ChatLaw 研發(fā)的階段,最大的難點在哪里?

袁粒:其實我們現(xiàn)在是有一個瓶頸,它就是我們的調(diào)度模型。

因為參數(shù)量的問題,我們認(rèn)為其實百億級的調(diào)度模型,它的效果可能并不那么令人滿意,我們之后會把它替換成別的算法。


千模大戰(zhàn)下

袁粒的技術(shù)判斷

AI科技評論:在團隊建設(shè)上,我們的團隊平均年齡有多大?

袁粒:我們的團隊不少都是00后,當(dāng)下有些還正在讀研。其中幾個比較優(yōu)秀的同學(xué),比如伯華,負(fù)責(zé)頂層設(shè)計和產(chǎn)品化,是我們項目的主要推動者;以及家熙,負(fù)責(zé)模型的訓(xùn)練,在科研上非常強。

AI 科技評論:在這樣一個年輕的團隊里,您觀察到,大家對 AI 和大模型有什么新的看法?

袁粒:這一屆年輕人都非常理性,從年初開始,團隊就在講,這是這會是一波巨大的科技浪潮,但是團隊也同時深知這個過程會比較慢,可能會持續(xù)很久。

在這樣一個比較慢的賽道,我們從一個商業(yè)的角度來說,更應(yīng)該是“以終為始”。

AI 科技評論:具有一種“終局思維”。

袁粒:是的,我們更關(guān)注這個局面下,哪些要素更重要?掌握哪些要素的人會贏?而我們現(xiàn)在做的,就是要去提前把這些成功要素給湊出來。

AI 科技評論:商業(yè)化一定是個很重要的要素。

袁粒:沒錯,但對于 ChatLaw,我們不會急于把它變成一個太商業(yè)化的項目。主要是,ChatLaw 的模式,可能并不適合大規(guī)模向 C 端收費——畢竟法律幫助是一個低頻需求。

現(xiàn)階段,我認(rèn)為 ChatLaw 還只是個showcase,是在我們一個名為 ChatKnowledge 這樣一個計劃中的第一步。

在做這個項目的同時,我們也積累了一整套的能力,包括我們剛才提到的模型調(diào)度能力,也包括外掛知識庫對生成內(nèi)容約束等等。

我們慢慢沉淀出來的 ChatKnowledge 這一整套打法,才是未來我們眼中的“終局”。未來我們也會走一些面向企業(yè)和政府的項目,來迎接大模型 AI 2.0 的潮流。

(未來,雷峰網(wǎng)會關(guān)注更多的大模型和 AIGC 賽道優(yōu)秀創(chuàng)業(yè)者,歡迎和本文作者:s1060788086,交流認(rèn)知,互通有無。)


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說