當前位置:編程學習大全網 - 源碼下載 - 開放科學平臺:大國科技競爭的關鍵變量

開放科學平臺:大國科技競爭的關鍵變量

作者:蘇中 阿裏研究院資深技術專家

當代 科技 發展對數據和算力提出了極高要求。在傳統基礎技術研究領域,科研院所、高校的科研團隊普遍缺乏這方面的能力支撐。為了應對這壹變化,近十年來,“開放科學平臺”在歐美逐漸盛行,為科研社區提供包含開放數據及相關分析工具、開放算力平臺、開放源代碼的各種支持。在科學技術的大國競爭時代,“開放科學平臺”逐漸成為推動 科技 發展的關鍵變量。中國在這個領域需要加大投入,從而實現科學範式轉變階段基礎科學平臺建設的跟跑、並跑直到領跑。

1

科學進步背後的規律:從“Paradigm Shift”到“第四範式”

科學進步的軌跡是什麽樣的?

早期,人們普遍認為,科學發展是循序漸進的,科學家不斷湧現,將已有科學理論向前推進從而推動科學發現越來越接近真理。

1962年,美國學者托馬斯·庫恩在《科學革命的結構》壹書中提出,以物理學 歷史 發展為例,科學發展存在有規律的不連續性。書中說,科學由壹系列交替的“正常科學階段”和“科學革命”階段組成。在科學革命階段,伴隨著概念層的突破,已有的理論框架被新科學範式全面顛覆並重構,例如從牛頓力學到量子力學的轉變。

庫恩創造了“範式轉變(Paradigm Shift)”這壹科學哲學新概念。在庫恩定義的範式轉變理論中,科學發現遵循的是另壹條五個階段的循環路徑:

1. “前範式階段”: 幾個不相容和不完整的理論,並逐漸收斂到壹種被科學界普遍接受主導範式

2. “正常科學階段”: 在主導範式的背景下不斷解決科學難題,推進科學進步

3. “危機階段”: 主導範式能未解決的異常現象,會在較長時期內不斷累積,最終導致主導範式的信任危機

4. “範式轉變階段”: 主導範式出現重大失敗後,科研基本假設被重新審視,進入新範式建立階段

5. “新範式階段”: 科學革命後,新範式主導地位確立

庫恩開創了壹門名為科學史或科學 社會 學的新學科。 社會 學家和 歷史 學家開始把科學看成壹種普通的亞文化。範式轉變推動科學發展已成廣泛***識。

庫恩之後,計算機領域的學界泰鬥、數據庫領域的傳奇科學家吉姆·格雷把科學技術發展史總結為四個範式階段:

1. 第壹範式:經驗(empirical)證據。 數千年文明史中,人類絕大多數技術發展源於對自然現象觀察和實驗總結。相比於宗教或神學中不允許被質疑的教條來說,基於觀察和實驗的經驗範式是科學技術發展中人類邁出的壹大步。

2. 第二範式:理論(theoretical)科學。 相比於依賴觀察和實驗的第壹範式可以做到“知其然”,第二範式的科學理論需要做到“知其所以然”,對自然界某些規律做出背後原理性的解釋。因此,理論必須滿足進壹步的要求,如可證偽的預測能力、多個獨立來源的壹致性等。

3. 第三範式:計算(computational)科學。 隨著計算機的運算能力越來越強大,它逐漸被用於科學研究領域。同前兩個範式不同,計算科學中誕生了壹種嶄新的技術工具:計算模型與系統模擬。這壹工具利用計算機的計算能力、基於大規模並行的計算機體系結構、通過設計算法並編制程序來模擬復雜過程,在大氣環流、核反應過程、病毒感染過程。在經濟學、心理學、認知科學等缺乏簡單、直觀分析解決方案的領域獲得廣泛采用。

4. 第四範式:數據科學(Data exploration)。 從基因測序儀、深空望遠鏡到覆蓋全球的社交媒體,人類 社會 已經被深度數字化。每天在我們生活的數字地球裏每天都會產生海量的數據。據估計到 2025 年,全球每天將新產生463 EB 的數據,相當於212,765,957 張 DVD,這些DVD疊在壹起有30個珠穆朗瑪峰那麽高。在這樣壹個數據爆炸的時代,基於數據的技術革命也正在發生,數據科學成為技術發展的最前沿。以數據為中心的計算平臺、數據加工、處理與分享工具、算法與模型庫等壹系列科學研究方式構成了技術發展的第四範式。

2

“開放科學平臺”:更好應對第四範式的挑戰

在第四範式主導的 科技 時代,研究團隊除了研讀技術最前沿研究論文,同時也需要這些論文涉及的實驗數據集,以便復現實驗結果。巨量數據和龐大計算需求給創新帶來了新的挑戰。傳統科學交流僅限於論文和有限的公開數據集,為了促進新範式時代技術發展的持續性,加速科研團隊的合作***享,歐美開始興起了“開放科學”運動:

arXiv: 美國物理學博士保羅·金斯帕格1991在美國洛斯阿拉莫斯國家實驗室創建了分享arXiv存儲庫,幫助全球科研團隊分享研究論文預印本的全文數字版本。2008年,arXiv突破了50萬篇文章的裏程碑;2014年底達到100萬篇;今天, arXiv每月從全球科研社區獲得超過15000篇投稿。壹些出版商還免費授予arXiv作者存檔同行評審後印本的權限。arXiv也鼓勵了更多科研機構,如美國國家醫學圖書館仿照arXiv建立了醫學領域的PubMed中央存儲庫。

Papers with Code: 相比arXiv,Papers with Code在開放獲取領域則更進壹步。這個平臺不僅分享論文,還鼓勵科研團隊分享論文工作所對應的代碼和數據集。平臺同時提供了相關評測環境,可以對提交的算法代碼在公***數據集合上做技術排名。Papers with Code不僅創建壹個包含論文、代碼和數據集的開放集合,同時也提供了技術評估方法的免費開放平臺,顯著促進了相關領域科研團隊技術分享與協作,加速 科技 創新進程。

NASA開源科學計劃: 為了降低太空科學 探索 門檻,讓更多的科研團隊可以參加美國國家航空航天局的科學研究,NASA 提出了開源科學計劃 (OSSI)。OSSI的目標是在十年內建立壹個開放科學社區,參與的科研團隊承諾在研發過程中開放和***享相關軟件、數據以及知識(包含算法、論文、文檔以及相關輔助信息),並充分利用協作工具和雲計算在內的技術工具提高NASA科學進步的速度和質量。

3

大國 科技 博弈:開放科學平臺的重要性

在第四範式時代,爆炸式增長的數據在 科技 研發工作中扮演了極其重要的角色,它也給經歷這壹次範式轉變中各個學科,尤其是非計算機領域的科研團隊帶來全新挑戰,涉及數據與模型的獲取與分享、計算模型與系統模擬的規模膨脹、大規模人工合成數據構造、多模態數據處理與分析的工具、數據抽取、轉換、加載、數據可視化與交互、人工智能工具集與算力平臺等領域。

今天,新壹輪大國競爭很大程度上 體現為支撐 科技 發展的生態系統以及創新體系之間的競爭,開放科學平臺已成為促進 科技 研發重要的基礎能力之壹。 以第四範式驅動的新壹代創新體系在歐美已經有先發優勢,從政府主導的科研項目到學術界的實踐已有十年經驗。我國需要在這個領域認識到不足,加速構建獨立自主的開放科學平臺,從而實現科學範式轉變階段 科技 發展的跟跑、並跑直到領跑。

參考文獻:

1./books/2012/jul/03/structure-scientific-revolutions-kuhn-review

2./biography/Thomas-S-Kuhn

3./en-us/research/publication/fourth-paradigm-data-intensive-scientific-discovery/

5.https://en.wikipedia.org/wiki/Metaphysics_(Aristotle)

6.https://www.weforum.org/agenda/2019/04/how-much-data-is-generated-each-day-cf4bddf29f/

7.https://www.skatelescope.org/8https://arxiv.org/help/stats/2021_by_area

END

  • 上一篇:個人形象海報制作軟件哪個好-ps下什麽軟件好用
  • 下一篇:妳會因為知識付費下載app嗎?
  • copyright 2024編程學習大全網