NVIDIAが初のエージェントAIベンチマークで、従来の20倍の性能を達成しました。このベンチマークは、複雑なAIエージェントの負荷を測定するために設計されており、NVIDIAの最新技術がその性能を大幅に向上させています。
NVIDIAの新しいベンチマークでの性能向上
NVIDIAは、初のエージェントAIベンチマーク「AA-AgentPerf」で、従来の20倍の性能を達成したと報じられています。このベンチマークは、AIエージェントがどの程度の負荷を処理できるかを測定するために設計されており、NVIDIAのハードウェアがその性能を大幅に向上させています。
AA-AgentPerfとは何か?
AA-AgentPerfは、Artificial Analysisが開発したハードウェアベンチマークで、AIエージェントが同時にどれだけの処理を行えるかを測定します。特定の性能目標(SLO)を満たすために、出力速度と初回トークン生成時間を基準にしています。これにより、さまざまなハードウェア構成間での比較が可能です。
代表的なエージェントのパフォーマンスを測定
エージェントの作業負荷は、非決定的なリクエストやツールコールを伴うため、測定が難しいとされています。AA-AgentPerfは、GPU上でのエージェントの作業を記録し、ツール使用の遅延をシミュレーションすることで、これを測定します。これにより、実世界のAIエージェントのコード作業を正確に反映したベンチマークが可能となります。
- AIエージェント
- 特定のタスクを自律的に実行するAIプログラムです。
- ベンチマーク
- 性能評価のための基準やテストのことです。
- SLO
- サービスレベル目標。システムが達成すべき性能基準です。
- NVIDIA Achieves Leading Agentic Coding Performance on First Agentic AI Benchmark(NVIDIA Technical Blog)
配信日: 2026-06-12
