11月21日中午,“數(shù)字與人文節(jié)氣沙龍”系列活動第52期暨人工智能研究院學術沙龍第23期舉行。講座聚焦人工智能與司法交叉領域,為與會者介紹大模型基礎理論知識、大模型監(jiān)督強化推理、智慧司法機遇與挑戰(zhàn)。本期沙龍由北京大學人工智能研究院楊浩主持,邀請北京大學人工智能研究院張牧涵擔任主講人,北京大學法學院黨委副書記、北京大學人工智能研究院副院長楊曉雷為與談人。來自法學院、人工智能研究院、國際關系學院等院系的多名師生參與討論。

活動現(xiàn)場

張牧涵作主題報告
講座從基本概念入手,幫助聽眾理解大語言模型的原理與技術基礎。張牧涵指出,公眾對大模型的認知最早源于GPT的發(fā)布。其核心特點包括:具備生成文本的能力、利用大規(guī);ヂ(lián)網(wǎng)語料進行廣泛訓練、預測下一個詞元的概率分布。張牧涵以“詞元”“分詞器”與“向量嵌入”等概念為例,說明模型如何將文本轉化為機器可處理的高維向量空間表示,并介紹注意力機制的作用。他將大模型的訓練分為三大階段,即通過海量互聯(lián)網(wǎng)文本,讓模型學習語言結構、邏輯關系與世界知識的預訓練階段;用任務型數(shù)據(jù)對模型進一步訓練,使其更貼近特定應用領域的微調階段;通過“獎勵機制”讓模型在對齊性、安全性、合規(guī)性等維度更加優(yōu)化的強化學習階段。當前業(yè)界正在嘗試通過更精細的推理訓練,提升模型的邏輯推理能力與可信度。
在技術基礎闡述后,張牧涵將大模型與“智慧司法”結合,指出其面臨的機遇與現(xiàn)實挑戰(zhàn)。機遇方面,大模型可協(xié)助初篩文書、提取證據(jù)要點、生成輔助意見等,極大提升司法文書處理效率。同時,智能咨詢、自動化法律檢索等功能為企業(yè)與個人提供更精準的信息服務,增強司法服務專業(yè)性與普惠性。大模型還可以助力司法行業(yè)的數(shù)字化升級。當然,法律場景對安全性、準確率的要求更高,模型錯誤可能造成嚴重后果,因此模型可靠性、推理一致性仍需提升。此外,法律知識結構復雜,但大模型的專業(yè)語料匱乏,需要更多團隊與專家參與。
張牧涵介紹了團隊正在構建的“元法大模型”體系,展示了模型如何從輸入的法律事實中抽取關鍵信息、生成稿件格式、補充必要的法規(guī)引用,逐步得出更符合司法體系要求的結構化輸出,并與現(xiàn)場與會者互動。張牧涵強調,當前團隊正在推進高難度、高價值的智慧司法研究項目,非常歡迎對AI、司法、數(shù)字治理等領域感興趣的同學加入,共同探索大模型在司法領域的未來發(fā)展方向。

楊曉雷進行回應
在對談環(huán)節(jié)中,楊曉雷圍繞“智慧司法”的主題進行進一步回應。他提出,法律體系可從“信息-知識-價值”三個維度理解;ヂ(lián)網(wǎng)時代極大提升了公眾獲取法律信息的能力,人工智能的出現(xiàn)進一步推動法律知識普及化,使普通人在復雜法律問題上的理解與判斷能力不斷增強。他強調,這類系統(tǒng)不僅能為普通公眾提供知識支持,也將提升專業(yè)法律群體的工作效率,有助于構建更高效的法律服務體系。同時,楊曉雷表示,真正的挑戰(zhàn)并非來自技術本身,而在于法律知識體系的邊界與不可完全形式化的部分,如價值判斷、道德意涵等。人工智能無法完全替代法律人的判斷,人機協(xié)作將成為未來法律工作的重要方向。

自由討論發(fā)言
在自由討論環(huán)節(jié)中,與會師生圍繞法律大模型的發(fā)展展開了深入交流,討論內(nèi)容涵蓋模型在數(shù)據(jù)標注、知識更新、反饋循環(huán)等方面的核心技術挑戰(zhàn),以及法律場景對大模型穩(wěn)定性和推理能力的特殊要求等。
本次活動中,社會科學部繼續(xù)與勺園中餐廳合作,推出小雪節(jié)氣特色美食,為與會師生提供了良好的交流環(huán)境。玻爾知識庫繼續(xù)為沙龍活動提供專屬知識庫,方便不同專業(yè)背景的觀眾了解主題內(nèi)容。

小雪節(jié)氣美食
信息來源: 北大社會科學部


