Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

富岳(A64FX)アーキテクチャ

このページは、2026-06-05の勉強会でチームが共有した富岳/A64FXに関する基礎をまとめたものです。

重要(要確認): チームは富岳(A64FX)を前提に最適化を調査していますが、2026年大会で使う実機は未確定です。 運営メモでは「4ノード・100+コアのCPUクラスタ」とされ、2025年大会では玄界が使われたとの情報もあります。 このページの内容は「富岳前提の調査」として扱い、最終ルールで実機を確認してください(調査ステータス)。

これは何か

富岳は理化学研究所のスーパーコンピュータで、CPUにA64FXを採用しています。

特徴内容
CPUA64FX(Armベース)
コア数48 Core(計算コア)
メモリHBM2(広帯域メモリ)
ベクトル拡張SVE512(Scalable Vector Extension、512bit幅)

なぜ重要か

A64FXはCPU演算性能が比較的強い一方で、**メモリ帯域がボトルネック(メモリ帯域律速)**になりやすい特性があります。 つまり「CPUを速くする」より「メモリアクセスと通信を改善する」方が効くことが多い、という前提で最適化を考えます。

メモリ帯域律速への対策

対策内容
データ局所性改善使うデータをまとめ、キャッシュに乗せる
キャッシュ利用改善アクセスパターンを連続的にする
配列配置変更(SVE活用)ベクトル化しやすいデータ配置にする

SVE(Scalable Vector Extension)は、ベクトル長に依存しないArmのSIMD拡張です。富岳では512bit幅(SVE512)です。

大会との関係

  • もし実機が富岳系なら、A64FX/SVE/HBM2の特性を踏まえた最適化が有効になります。
  • ただし前述のとおり実機は未確定です。実機が異なる場合、-marchやSVE前提の最適化は効果が変わります。

注意点

  • 「A64FXは強いらしい」という認識はあくまで一般論で、実アプリ(OpenFOAM等)では帯域・通信が律速になりがちです。
  • 実機・コンパイラ・利用可能ツールは大会のルール公開後に必ず見直します。

関連ページ

参考文献