1、合理使用多線程。
2、減少不必要的調用。
3、優化算法。
4、算法並行化
冒泡排序算法和選擇排序算法的時間復雜度為N的平方,快速排序算法的時間復雜度為N logn。這樣的方法實際上是算法並行化的核心思想。以空間交換時間,增加存儲資源的開銷,以保證數據的快速處理。這是唯壹適合GPU的特性。
5、數據並行化
原則上,數據越規則,如16 × 16、32 × 32數據塊。當然,最好匹配硬件的特性,比如硬件的位寬。
6、並行化操作
在這壹步中,嚴格地說,其實就是對算法的壹些細節進行了優化。