從硬件上分為 CPU 並行和GPU 並行
CPU 並行目前主要有:
1. 進程級適用於分布內存的MPI 並行(參考書 百度 都誌輝)
2. 線程級別的openmp (參考書:百度 fortran openmp)
需要註意的是 MPI 相對底層壹點,openmp 則非常簡單 基本上1個月能夠將妳的程序並行化。 但前者的效率要高於後者 當然我是說妳程序編寫合理的情況下。
GPU 並行:
目前的顯卡基本上都支持GPU並行,只要妳的顯卡不是很老,都可以用來做GPU 並行計算。 GPU計算說通俗壹點就是借助顯卡的處理核心來做科學計算,有效發揮顯卡的多核計算能力
如果妳要進行GPU 編程,那麽建議學習CUDA 對應於C 有cuda C 對應於fortran 有cuda fortran 當然 目前cuda fortran 的編譯器只有pgi, 妳可以很方便在網上下載到試用版本。
就這麽多吧,僅供參考。有什麽問題可以在群裏 或者在論壇裏面提問,大家來討論。
最後還補充壹下,如果妳有正版PGI的話,也可以用openacc 也是壹種簡化的cuda 大體上就是妳在代碼中加入壹些編譯指導語句,然後編譯器幫妳把代碼cuda 並行化。相當於cpu 並行裏的openmp。