2025年大会の振り返り
公式発表で確認できる2025年課題
HPC-AI Advisory Councilの2025年結果PDFでは、2025年大会の課題が次のように説明されています。
| 部門 | 課題 |
|---|---|
| HPC Track | NWChemによる計算化学シミュレーションの実行時間最小化 |
| AI Track | SGLangを使ったDeepSeek-R1 671B推論スループット最大化 |
公式PDFでは、参加者がprofiling、algorithmic refinements、architecture-specific tuningを使ってHPC/AI性能を改善したことも説明されています。
日本チームの結果
東京農工大学などのプレスリリースでは、理研R-CCSが支援した4チームの入賞が確認できます。
| チーム | 賞 |
|---|---|
| T0M0K4ZU w/ RIKEN | 総合部門 Merit Award |
| Moralistars w/ RIKEN | HPC部門 Best HPC Performance賞 |
| SQUID w/ RIKEN | HPC部門 Excellent HPC Performance賞 |
| Kisarazu Big Branch team w/ RIKEN | AI部門 Excellent AI Performance賞 |
このプレスリリースでは、理研R-CCSが2025年大会から学生出場支援事業を開始し、練習用計算資源として九州大学のスーパーコンピュータ「玄界」の利用支援などを行ったことも説明されています。
参加記から得られる実践知
木更津高専チームの参加記は公式ルールではありませんが、初心者チームが何に詰まるかを知るうえで有用です。
主な学びは次の通りです。
- 最初の数週間は、最適化以前にクラスタ、VPN、2FA、ジョブスケジューラ、モデルロードに慣れる時間になる。
- 2025年のAI側では、SGLang公式ドキュメントとブログを読み、parallelism、batch size、network、attention、MoE/MTPなどを調べている。
- 実験は300回規模になり得るため、実験前に仮説を書き、実験後に設定、結果、ログ、解釈を残す仕組みが必要。
- 成功例だけでなく、期待した高速化が出なかった例も重要。例えばDP Attentionは文献上よく見えても、実環境ではスループットが落ちる可能性がある。
2026年に引き継ぐべき教訓
- ベースラインをまず動かす。
- 実行時間、ロード時間、I/O、ネットワーク、GPU使用率、CPU使用率を分けて見る。
- 「速くなった」ではなく、「どのメトリクスが、どの条件で、どれだけ変わったか」を記録する。
- 大会ルール上禁止される可能性がある変更を、早い段階でリストアップする。
- プレゼン評価もあるため、最終スコアだけでなく実験設計と説明可能性を残す。