第274章 講座_離語_线上阅读小说网 
线上阅读小说网 > 玄幻魔法 > 離語 > 第274章 講座

第274章 講座(1 / 2)

132研究方法

本文以有關電力行業lca的近十年的英文文獻為研究對象,並根據每篇文章的元數據構建數據

庫。進行文檔分割,將文件分割為更小的部分或章節,分區後使其更容易分類和提取文本,將文檔

元素列表存儲並跟蹤從文檔中提取的各種元數據,將文本元素分割為適合模型注意力窗口的大小,

構建向量數據庫,方便大模型調用。利用rag(檢索增強生成)模型,幫助大語言模型知曉具有電

力lca領域專業性和時效性的知識,包括最新的新聞、公式、數據等內容,增強大模型回答關於電

力行業lca領域專業性問題與時效性問題的能力,主要用到的研究方法如下。

(1)文獻資料法。通過閱讀大量國內外研究檢索增強生成的文章,確定將rag技術作為提升

大語言模型回答電力行業lca領域問題專業性與時效性問題的解決方法。文獻調研顯示,聚焦於此

領域的大模型是一個研究空白,將電力行業lca的大模型應用於企業層麵的分析,能夠響應了重大

戰略。該方法能夠提升科研眼界、開闊研究思路、豐富研究角度。

(2)實驗法。本文使用爬蟲程序抓取各頂級期刊官網上近十年的文章,並通過元數據處理方

法,構建文章元數據的數據庫。

(3)實證分析法。本文通過大量實際數據,來驗證大模型調用電力行業lca領域向量數據庫

回答該領域專業性問題和時效性問題的有效性。

133係統設計

係統設計三個模塊,整體設計如圖14所示,分彆是數據處理模塊、專業領域知識庫構建模塊

以及chatbot構建模塊。數據處理模塊主要包括對電力lca這個特定領域的英文文獻進行選擇和初

步處理,而後將有關數據全部轉化成結構化數據。知識庫構建模塊主要是將數據向量化並構建向量

知識庫。chatbot構建分為功能部分和前端部分,功能包括openai基座的調用、知識庫檢索、在

線檢索;前端部分為eb可視化以及ui設計。

14本章小結

第一章作為本論文的引言部分,主要圍繞研究背景、研究目的與意義、研究內容與方法以及係

統設計進行了全麵的闡述。首先,本章通過詳細闡述當前大模型技術在內容解析領域的背景,指出

了電力行業生命周期評價的重要性,並強調了研究流程和研究方法。在這一基礎上,本章進一步明

確了項目係統功能設計。綜上所述,本章作為論文的引言部分,為整個研究了清晰的研究背

景、目的、意義、內容及方法概述,為後續章節的展開奠定了堅實的基礎。

21大語言模型

chatgpt是由openai發布的一種大語言模型,能夠以問答的形式完成各類任務,包括接受文

字輸入,理解自然語言,理解響應並模擬人類對話形式進行輸出。再各個自然語言處理子任務具有

優異的表現。相比其他大語言模型擁有更豐富的知識,涵蓋自然、社會科學、人文曆史等多個領

域。chatgpt在gpt35的基礎上引入了rlhf(rercefrohuanfeedback)

技術,通過將人類的日常對話的語言習慣嵌入模型,並引入價值偏好,使得模型的輸出滿足人類的

意圖。微調過程分為預訓練、監督微調、設計獎勵模型和反饋優化。桑基韜等人根據chatgpt的對


最新小说: 狂雷曲 天機陰陽變 倒黴穿越者:誤入小說世界 糟糕!攻略的病嬌男主怎麼成真了 足球:十九歲喜提大器晚成係統! 我在萬人迷劇本中給對家係統打工 足球:帝王征途 班花談不上,那我就和校花談戀愛 我都屠儘諸神了,囂張一點怎麼了 光幕盤點:萬界一起來追番