清華新聞網(wǎng)1月21日電(通訊員 陳楚珂)近日,清華大學(xué)環(huán)境學(xué)院徐明教授團(tuán)隊(duì)系統(tǒng)比較了大語(yǔ)言模型在生態(tài)環(huán)境決策中的多種應(yīng)用路徑,明確了領(lǐng)域微調(diào)、智能體工作流及新一代通用模型在復(fù)雜、多步驟決策中的功能邊界。研究提出了以決策場(chǎng)景建模、工作流化設(shè)計(jì)和模型分工為核心的應(yīng)用策略,為構(gòu)建貼近實(shí)際決策邏輯并且可與專(zhuān)家判斷過(guò)程對(duì)齊的生態(tài)環(huán)境智能決策系統(tǒng)提供了方法參考。
隨著大語(yǔ)言模型應(yīng)用不斷拓展,如何將其有效引入生態(tài)環(huán)境決策過(guò)程成為環(huán)境信息化與智能化轉(zhuǎn)型中的關(guān)鍵問(wèn)題。不同于通用問(wèn)答任務(wù),生態(tài)環(huán)境決策通常涉及法規(guī)與標(biāo)準(zhǔn)檢索、監(jiān)測(cè)數(shù)據(jù)分析、定量計(jì)算與結(jié)果核驗(yàn)等多環(huán)節(jié)協(xié)同,對(duì)模型在復(fù)雜決策流程中的整體表現(xiàn)提出了更高要求。然而,現(xiàn)有研究多聚焦單一任務(wù)或靜態(tài)評(píng)測(cè),對(duì)不同模型應(yīng)用路徑在真實(shí)決策結(jié)構(gòu)中的系統(tǒng)比較仍然不足。這使得一個(gè)關(guān)鍵問(wèn)題長(zhǎng)期懸而未決:在復(fù)雜生態(tài)環(huán)境決策場(chǎng)景下,大模型究竟應(yīng)如何配置,才能更好地服務(wù)于實(shí)際決策需求。
針對(duì)上述問(wèn)題,徐明團(tuán)隊(duì)構(gòu)建了基于環(huán)境教材和典型應(yīng)用場(chǎng)景的數(shù)據(jù)集與任務(wù)基準(zhǔn),將領(lǐng)域微調(diào)模型、新一代通用基礎(chǔ)模型以及引入工具調(diào)用與反思機(jī)制的智能體工作流,統(tǒng)一嵌入包含檢索、計(jì)算與結(jié)果核驗(yàn)等環(huán)節(jié)的真實(shí)決策工作流中進(jìn)行系統(tǒng)比較,重點(diǎn)評(píng)估不同模型在復(fù)雜、多步驟環(huán)境決策中的整體表現(xiàn)及其與專(zhuān)家決策邏輯的一致性。
研究結(jié)果表明,領(lǐng)域微調(diào)在規(guī)則明確、流程固定的任務(wù)中可帶來(lái)有限(+1%)但穩(wěn)定(+10%)的性能提升,但在涉及多步驟推理和工具協(xié)同的復(fù)雜決策場(chǎng)景中,其優(yōu)勢(shì)迅速減弱。在同等參數(shù)規(guī)模條件下,新一代通用模型在多學(xué)科知識(shí)整合與任務(wù)分解方面表現(xiàn)更優(yōu),而基于通用模型構(gòu)建的智能體工作流通過(guò)顯式的任務(wù)分解與工具協(xié)同,在系統(tǒng)層面實(shí)現(xiàn)了更高的整體性能(+10%)。

圖1.微調(diào)模型、基線(xiàn)模型與最新通用模型及其智能體工作流的性能對(duì)比
研究指出,生態(tài)環(huán)境領(lǐng)域大模型應(yīng)用的關(guān)鍵不在于單一模型能力的提升,而在于對(duì)決策場(chǎng)景的清晰建模、對(duì)決策流程的工作流化設(shè)計(jì)以及對(duì)不同模型能力的合理分工。領(lǐng)域微調(diào)更適用于穩(wěn)定、可驗(yàn)證、規(guī)則驅(qū)動(dòng)的核心工序或作為校驗(yàn)?zāi)K,而智能體工作流則更適合承擔(dān)動(dòng)態(tài)、數(shù)據(jù)密集、跨學(xué)科的決策鏈路任務(wù)。該研究為構(gòu)建貼近實(shí)際決策邏輯、具備可解釋性與可靠性的環(huán)境智能決策系統(tǒng)提供了方法參考。

圖2.大語(yǔ)言模型在生態(tài)環(huán)境領(lǐng)域中的應(yīng)用策略(本圖由Google Nano Banana Pro生成)
研究成果以“面向復(fù)雜生態(tài)環(huán)境問(wèn)題的大語(yǔ)言模型應(yīng)用:結(jié)構(gòu)化微調(diào)數(shù)據(jù)集與應(yīng)用策略”(Leveraging LLMs for Environmental Complexity: Structured Fine-Tuning Data Sets and Deployment Strategies)為題,于北京時(shí)間1月1日發(fā)表于《環(huán)境科學(xué)與技術(shù)》(Environmental Science & Technology)。
清華大學(xué)環(huán)境學(xué)院博士后陳楚珂為論文第一作者,環(huán)境學(xué)院副研究員李楠和教授徐明為論文共同通訊作者。研究得到國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家自然科學(xué)基金、清華大學(xué)“水木學(xué)者”計(jì)劃、亞馬遜研究基金等項(xiàng)目的支持。
論文鏈接:
https://doi.org/10.1021/acs.est.5c09526
供稿:環(huán)境學(xué)院
編輯:李華山
審核:郭玲