王卷樂等在Science Bulletin發(fā)文提出地球科學數(shù)據(jù)FAIR治理建議
FAIR原則(可發(fā)現(xiàn)、可訪問、可互操作、可重用)自2016年提出以來,已成為多學科數(shù)據(jù)治理的重要指導框架。然而,在地球科學領(lǐng)域,其實踐仍面臨固有挑戰(zhàn):數(shù)據(jù)來源多樣、格式繁雜、標準不一;研究跨越從瞬時觀測到百萬年地質(zhì)記錄的極大時空尺度;數(shù)據(jù)語義豐富且空間異質(zhì)性強,卻缺乏統(tǒng)一術(shù)語體系;全球超1200個地學數(shù)據(jù)庫高度集中在歐美發(fā)達國家,地理分布極不均衡。人工智能(AI)時代的到來對AI就緒數(shù)據(jù)(AI-Ready Data)提出了迫切需求。為填補這一方法空白,中國科學院地理科學與資源研究所王卷樂研究員聯(lián)合多家單位多位專家,在數(shù)據(jù)治理層面系統(tǒng)性地提出了面向地球科學數(shù)據(jù)的24項FAIR實施建議,為科學數(shù)據(jù)治理與AI驅(qū)動科學范式轉(zhuǎn)型提供了具體的方法論參考。
在可發(fā)現(xiàn)維度,研究強調(diào)機器可操作性與全球平衡,建議分配持久標識符、豐富元數(shù)據(jù)描述,并呼吁鼓勵發(fā)展中國家建立輕量級目錄注冊平臺以改善地理分布失衡。在可訪問維度,研究突出開放標準與安全保障并重,主張采用主流非專有格式、開放API接口和元數(shù)據(jù)與數(shù)據(jù)分離保存機制,并針對敏感數(shù)據(jù)提出分級共享機制。在可互操作維度,研究聚焦語義與技術(shù)的雙重統(tǒng)一,建議建立統(tǒng)一領(lǐng)域知識體系,采用通用格式并針對AI模型優(yōu)化為高性能格式,利用關(guān)聯(lián)數(shù)據(jù)技術(shù)增強語義互操作。在可重用維度,研究超越傳統(tǒng)共享范疇,提出開發(fā)在線分析引擎記錄數(shù)據(jù)來源、建立數(shù)據(jù)引用激勵機制、將CARE原則融入數(shù)據(jù)許可管理,并針對AI應用提供代碼使用示例。
該研究成果于2026年2月發(fā)表于Science Bulletin,中國科學院地理科學與資源研究所王卷樂研究院為通訊作者兼第一作者。該成果得到國家重點研發(fā)計劃等資助。
論文信息:?J. Wang, Z. Shen, Z. Xu et al., Adding FAIRness to Earth science data, Science Bulletin, https://doi.org/10.1016/j.scib.2026.02.047
論文鏈接:?https://authors.elsevier.com/a/1mnfL7SZmRlSjz

附件下載: