Nvidia邁向超級計算機
頁面目錄:
- 導言
- 挑戰以及目標
- 能效性
- 程序設計
- 異構計算節點
- 系統節點
- 開放式HPC生態系統
- 結論
挑戰以及目標
最大的挑戰之一是如何建造更好的指標。在過去,人們通過建造大型望遠鏡、大型粒子加速器和大型計算機來進行科學研究。然而,今天科學研究和商業決策都需要大型計算機。所以,今天的目標是擁有最好的計算機,這是一個相對目標,即具有真實應用程序的通量效能1百萬億次/秒,並且功耗不超過20兆瓦。
能效性
能效性是實現目標的關鍵。首先,我們需要解決能源效率的問題。對於很多計算機來說,大部分的能量都花在處理器上,而不是計算。為了提高能源效率,需要減少處理器的開銷,提高計算的機會。
其次,數據移動也是一個非常昂貴的過程。將數據從處理器移動到記憶體需要耗費大量的能量。因此,我們需要找到更有效的方法來移動數據,並減少這一過程的能量消耗。
程序設計
為了實現目標,我們需要改變並優化程序設計。並行編程可以幫助我們發掘更多的並行性並減少數據移動帶來的負擔。通過將程序設計成面向集合的操作,我們可以更好地利用計算機的並行性和局部性。
我們的目標是建立一個目標獨立的編程系統,其中程序設計師可以表達並行性和局部性,並讓工具對其進行映射。這樣,我們可以創建可攜式代碼,在不同的計算機上運行,而無需進行大量修改。
異構計算節點
異構計算節點是實現目標的硬件支持。對於處理低延遲和高吞吐量的任務,我們需要最優化的處理器核心。對於密集的並行任務,我們需要更高效的圖形處理器(GPU)。通過結合這兩種類型的處理器,我們可以實現更好的能效性和性能。
系統節點
系統節點是達到超級計算目標的一部分。在我們設計的超級計算機中,系統節點包括異構計算節點、高帶寬存儲器、非易失性存儲器和高效的內部通信對接。這些元素的結合使我們能夠達到更高效的大規模計算。
開放式HPC生態系統
我們的目標是建立一個開放式HPC生態系統,讓不同的供應商參與其中。這樣可以創建最佳的技術組合,並避免依賴於單一供應商。我們希望通過定義一組標準來建立開放式系統區域網絡,從而實現更好的互操作性。
結論
達到超級計算目標面臨著許多挑戰,包括能源效率、數據移動成本和程序設計。通過優化硬件和改進程序設計,我們可以實現更好的能效性和性能。同時,建立開放的HPC生態系統將促進技術創新和合作,加速超級計算的發展。
簡而言之,我們的目標是建造一個能夠實現千億次計算性能的超級計算機,同時保持能源效率和可擴展性。通過優化能效、改進程序設計和建立開放的HPC生態系統,我們可以實現這一目標。