類型:微電影 地區(qū):大陸 年份:2021
簡介:數(shù)據(jù)預(yù)處理的步驟包括:數(shù)據(jù)清洗:刪除重復(fù)的記錄,校正錯(cuò)誤的數(shù)據(jù)格式,填補(bǔ)缺失值,數(shù)據(jù)整合:將來自不同來源的數(shù)據(jù)整合到一個(gè)統(tǒng)一的格式和數(shù)據(jù)庫中,如表3.1所示,以便進(jìn)行進(jìn)一步的分析,為了使后續(xù)知識(shí)庫生成更加準(zhǔn)確與完善,對文獻(xiàn)具體內(nèi)容進(jìn)行篩選,例如部分文獻(xiàn)中并未提到所用數(shù)據(jù),而是指出所用數(shù)據(jù)庫鏈接,如圖3.3所示,在對該篇文獻(xiàn)進(jìn)行解析后,數(shù)據(jù)部分就是欠缺的,最終構(gòu)建的知識(shí)庫就不完整,在調(diào)用大模型回答相關(guān)問題時(shí),極大概率產(chǎn)生幻覺,因此為了構(gòu)建更為準(zhǔn)確的專業(yè)模型,對爬取下來的507篇文獻(xiàn)進(jìn)行篩選,選擇包括流程圖(systemboundaries)、各單元過程或生產(chǎn)環(huán)節(jié)的投入(input),產(chǎn)出(output),數(shù)據(jù)(lifecycleinventory),以及數(shù)據(jù)的時(shí)間、地點(diǎn)、獲取方法、技術(shù)細(xì)節(jié)的文獻(xiàn)作為最后應(yīng)用的數(shù)據(jù)。
本站所有內(nèi)容均來自互聯(lián)網(wǎng),如果本站部分內(nèi)容侵犯您的版權(quán)請告知,在必要證明文件下我們第一時(shí)間撤除
Copyright ? 2019-2025; Inc. All Rights Reserved.