XBOX 360

by syoyo

XBOX 360 が公表されました。

http://www.itmedia.co.jp/games/articles/0505/13/news012.html

おどろいたのは、システム全体で 1T flops という性能。
うーん、すごいなぁ、けど、そんな数字ってありえるのかな?

というわけで少し考えてみました。

まず、CPU は、9 G 内積演算で 115.2 Gflops です。

3 component(3 fmadd) の内積専用命令があると考えれば、

3.2(GHz) * 3(プロセッサ) * 4(SIMD) * 3(fmadd)  = 115.2 G
flops

と計算どおりです。

んで、 GPU は、48 way のシェーダパイプとありますが、
これは今の GPU で用いられているピクセルパイプで言えば 12 本相当
という意味でしょう(12 * 4 = 48)。

統一シェーダ化により、4 要素固定のピクセルパイプではなく、
より柔軟な 3 要素のベクトル演算とか、2 要素の
ベクトル演算を動的に構成していくアプローチを取っていそうです。
そのため、48 way という表記を
用いているのではないでしょうか。

シェーダパイプは秒間 48 G シェーダ命令(スカラ命令?)を
実行できるようです。

GPU はコアクロック 500 MHz ですが、シェーダパイプは
倍速の 1 GHz で動いるのでしょう。

NV みたいに、1 シェーダパイプ内に縦積みで 2 fp 演算器があるとすると、

48(inst) * 1(GHz) * 2(fp ALUs) * 2(fmadd) = 192
Gflops

CPU とのトータルで 1 T にはまだまだですね。

1 シェーダパイプ内に 3 fp, 4 fp 演算器があるとすると、

48(inst) * 1(GHz) * 3(fp ALUs) * 2(fmadd) = 288
Gflops
48(inst) * 1(GHz) * 4(fp ALUs) * 2(fmadd) = 384
Gflops

うーん、やっぱりまだ足りない。

というわけで、どうもテクスチャユニットでの fp テクスチャを引くときの
フィルタリングとか、ROP(Raster OPeration unit)での fp ブレンドとかの
flops も考慮に入れて、トータルで 1 T って言っているのかなぁと思います。

Advertisements