富岳(A64FX)アーキテクチャ
このページは、2026-06-05の勉強会でチームが共有した富岳/A64FXに関する基礎をまとめたものです。
重要(要確認): チームは
富岳(A64FX)を前提に最適化を調査していますが、2026年大会で使う実機は未確定です。 運営メモでは「4ノード・100+コアのCPUクラスタ」とされ、2025年大会では玄界が使われたとの情報もあります。 このページの内容は「富岳前提の調査」として扱い、最終ルールで実機を確認してください(調査ステータス)。
これは何か
富岳は理化学研究所のスーパーコンピュータで、CPUにA64FXを採用しています。
| 特徴 | 内容 |
|---|---|
| CPU | A64FX(Armベース) |
| コア数 | 48 Core(計算コア) |
| メモリ | HBM2(広帯域メモリ) |
| ベクトル拡張 | SVE512(Scalable Vector Extension、512bit幅) |
なぜ重要か
A64FXはCPU演算性能が比較的強い一方で、**メモリ帯域がボトルネック(メモリ帯域律速)**になりやすい特性があります。 つまり「CPUを速くする」より「メモリアクセスと通信を改善する」方が効くことが多い、という前提で最適化を考えます。
メモリ帯域律速への対策
| 対策 | 内容 |
|---|---|
| データ局所性改善 | 使うデータをまとめ、キャッシュに乗せる |
| キャッシュ利用改善 | アクセスパターンを連続的にする |
| 配列配置変更(SVE活用) | ベクトル化しやすいデータ配置にする |
SVE(Scalable Vector Extension)は、ベクトル長に依存しないArmのSIMD拡張です。富岳では512bit幅(SVE512)です。
大会との関係
- もし実機が富岳系なら、A64FX/SVE/HBM2の特性を踏まえた最適化が有効になります。
- ただし前述のとおり実機は未確定です。実機が異なる場合、
-marchやSVE前提の最適化は効果が変わります。
注意点
- 「A64FXは強いらしい」という認識はあくまで一般論で、実アプリ(OpenFOAM等)では帯域・通信が律速になりがちです。
- 実機・コンパイラ・利用可能ツールは大会のルール公開後に必ず見直します。