NVIDIA Blackwellで推論性能を15倍向上
2026-06-24
DFlashは、NVIDIA Blackwell上で推論性能を最大15倍向上させる軽量ブロック拡散モデルです。従来の自己回帰型モデルと異なり、DFlashは未来のトークンを一度の推論で生成することで、GPUの利用率を高め、レイテンシの問題を解決します。この技術により、gpt-oss-120bやLlama 3.1 8Bモデルでのインタラクティビティが向上し、開発者はHugging Faceで公開されたチェックポイントを利用して容易に導入できます。