10月15日下午,中國科學院上海營養與健康研究所所級科學數據中心舉辦了“生物元數據治理與管理平臺應用”培訓,旨在幫助科研人員了解和掌握生物元數據治理的關鍵技術和方法,通過有效的元數據治理策略,提升生物樣本數據的可用性和研究價值。本次培訓由中心吳祉樂工程師擔任主講人。
吳祉樂首先系統地介紹了生物元數據的概念、類型及其在科學研究中的關鍵作用。生物元數據是指描述生物樣本或實驗條件特性的數據,對于理解復雜的生物信息至關重要。這些數據包括樣本采集時間、地點、環境特性以及宿主狀態等關鍵信息,為后續的數據分析提供了必要的上下文。然而,隨著生物數據量的不斷增長,不同數據庫之間存在的技術差異和組織架構差異導致了數據整合難、利用效率低等問題。
針對這些挑戰,吳祉樂重點講解了中心提出的一套系統的組學樣本元數據治理策略。該策略包括從主流生物樣本組學數據庫中收集大量的元數據;設計穩定且兼容性強的數據架構來重組元數據;基于實際需求建立如水圈數據標準等的數據規范;最后,通過數據消歧、填補和標準化等一系列措施對元數據進行治理,并將處理后的元數據回流至原始數據庫以確保長期有效性。吳祉樂還以水圈數據集為例對該策略進行了詳細說明。
為了更好地解決上述問題,所級科學數據中心開發了國際生物組學元數據管理平臺AntNest(https://www.biosino.org/antnest),吳祉樂在培訓現場進行了展示。該平臺以“螞蟻搬家”的方式實現國際公共數據庫中海量組學原始測序數據的下載、本地化、整合、歸檔和管理。旨在促進全球范圍內生物數據資源的有效管理和利用。
培訓過程中,學員們積極參與,踴躍發言,并與吳祉樂就元數據治理的具體技術細節進行了深入討論。通過此次培訓,科研人員不僅提升了對生物元數據治理重要性的認識,也掌握了一系列實用的方法論指導。
營養與健康所所級科學數據中心將持續舉辦相關主題的培訓活動,以幫助更多的科研人員了解中心提供的保全、保供、增值、定制等四類服務。同時,所級科學數據中心還設計了相關的調研問卷(詳見文末二維碼),誠邀科研人員提出寶貴的意見和建議,以便進一步優化和提升服務質量。通過與科研人員的積極互動和反饋,中心將不斷改進服務流程,提升技術支持質量,為進一步滿足科研需求提供更加優質的服務。

國際生物組學元數據管理平臺

吳祉樂作培訓報告
