Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

2025年大会の振り返り

公式発表で確認できる2025年課題

HPC-AI Advisory Councilの2025年結果PDFでは、2025年大会の課題が次のように説明されています。

部門課題
HPC TrackNWChemによる計算化学シミュレーションの実行時間最小化
AI TrackSGLangを使ったDeepSeek-R1 671B推論スループット最大化

公式PDFでは、参加者がprofiling、algorithmic refinements、architecture-specific tuningを使ってHPC/AI性能を改善したことも説明されています。

日本チームの結果

東京農工大学などのプレスリリースでは、理研R-CCSが支援した4チームの入賞が確認できます。

チーム
T0M0K4ZU w/ RIKEN総合部門 Merit Award
Moralistars w/ RIKENHPC部門 Best HPC Performance賞
SQUID w/ RIKENHPC部門 Excellent HPC Performance賞
Kisarazu Big Branch team w/ RIKENAI部門 Excellent AI Performance賞

このプレスリリースでは、理研R-CCSが2025年大会から学生出場支援事業を開始し、練習用計算資源として九州大学のスーパーコンピュータ「玄界」の利用支援などを行ったことも説明されています。

参加記から得られる実践知

木更津高専チームの参加記は公式ルールではありませんが、初心者チームが何に詰まるかを知るうえで有用です。

主な学びは次の通りです。

  • 最初の数週間は、最適化以前にクラスタ、VPN、2FA、ジョブスケジューラ、モデルロードに慣れる時間になる。
  • 2025年のAI側では、SGLang公式ドキュメントとブログを読み、parallelism、batch size、network、attention、MoE/MTPなどを調べている。
  • 実験は300回規模になり得るため、実験前に仮説を書き、実験後に設定、結果、ログ、解釈を残す仕組みが必要。
  • 成功例だけでなく、期待した高速化が出なかった例も重要。例えばDP Attentionは文献上よく見えても、実環境ではスループットが落ちる可能性がある。

2026年に引き継ぐべき教訓

  1. ベースラインをまず動かす。
  2. 実行時間、ロード時間、I/O、ネットワーク、GPU使用率、CPU使用率を分けて見る。
  3. 「速くなった」ではなく、「どのメトリクスが、どの条件で、どれだけ変わったか」を記録する。
  4. 大会ルール上禁止される可能性がある変更を、早い段階でリストアップする。
  5. プレゼン評価もあるため、最終スコアだけでなく実験設計と説明可能性を残す。

参考文献