G80 performance

[En] TODO… [Ja] G80 での数学関数のパフォーマンスはどんなものかと少し調べてみました [1,2]。 (G80 の場合サイクル数 = レイテンシ = throughput のようです) – floating point mul/add などの基本演算は 4 サイクル – log は 16 サイクル – その他の逆数、exp, sin などは 32 サイクル 以外と個々の演算はサイクル数がかかりますね。 ただ、サイクル数はベースクロックでの値のようで、ALU は内部で2倍のクロックで動いているため、 この半分になると見るとよいみたい。 (さらに SP には 2 器 ALU が搭載されているので、 基本演算なら実質 SP あたり 1 サイクルでできることになります) そして、ピークパフォーマンスの比較は [2] によれば、 – G80(GTX): 345 GFLOPS –Continue reading “G80 performance”

Sony Vector Math library and SIMD math library

Sony Vector Math library and SIMD math library open sourced http://bulletphysics.com/Bullet/phpBB2/viewtopic.php?p=4884 [En] TODO [Ja] MUDA で数学関数(log とか sin とか)どうするかな、と web をあさって見つけました。 PPU と SPU 向けですが、4 要素同時の logf, sinf とかがあります。 license は BSD と緩いので、これを SSE 版に porting しようかと思います。 というかこれこそコードを MUDA で書くのがいいかも。 経緯 精度はそれほど正確でなくていいので SSE 使って早い数学関数ルーチンはないかなぁと探していたのですが、 見つかるのはベンダが提供している SIMD Math Library(Accelerate.framework on Mac とか)とかばかり。 これらはみんな closed source なのでどの環境でも使えないという問題がある。Continue reading “Sony Vector Math library and SIMD math library”

MUDA note

[En] I wrote initial documents for MUDA by using google notebook, as Prof. nyaxt is using it for his renderer. `MUDA note’ provides thoughts and implementation notes for MUDA. You may feel inconvinience since `MUDA note’ is written in Japanese. I’ll write English version in the future, but not for now. [Ja] nyaxt 先生に見習って、私も googleContinue reading “MUDA note”

Faster Ray Packets – Triangle Intersection through Vertex Culling

Faster Ray Packets – Triangle Intersection through Vertex Culling Alexander Reshetov http://kesen.huang.googlepages.com/rt2007Papers.htm [En] This is quite interesting paper and I think VC(vertex culling) would be a promising method for future realtime/offline ray tracing. To summarize, – Calculate ray frustrum for each leaf node when the ray packet enteres it. – VC can reject 90% orContinue reading “Faster Ray Packets – Triangle Intersection through Vertex Culling”

clang, C frontend for LLVM

http://clang.llvm.org/ [En] Wow!, clang(though it’s in very early stage) is released as open-source. I must play with it. [Ja] LLVM の C/C++ フロントエンドである clang がいつの間にやら公開されはじめていました。 まだまだ開発初期段階のようですが、結構よさそう。 サンプルを見てみましたが、gcc には vector_size という__attribute__ があるのですね。 clang はそれにも対応していて、ちゃんとベクトル要素の LLVM code を吐くようになっています。 そしてあとは LLVM バックエンドが勝手に AltiVec や SSE に変換してくれています。 うーん、SIMD コード生成は clang + LLVM でいいかも。 MUDA の存在意義がなくなりつつあるか?…

RTSL: a Ray Tracing Shading Language

RTSL: a Ray Tracing Shading Language Steven G. Parker, Solomon Boulos, James Bigler, and Austin Robinson. To appear IEEE Symposium on Interactive Ray Tracing 2007 http://www.cs.utah.edu/~boulos/research.htm [En] Wow, this is a good paper… and what I am trying to do with my MUDA language [1] is already almost achieved by RTSL paper! For instance, –Continue reading “RTSL: a Ray Tracing Shading Language”

Fed Cuts Discount Rate, Recognizing Need to Stem Credit Crisis

Fed Cuts Discount Rate, Recognizing Need to Stem Credit Crisis http://www.bloomberg.com/apps/news?pid=20601087&sid=aE1A7RkmKsag&refer=home [En] Wow, Bernanke finally did it!(although he decided to cut interest rate off, not FF rate). I suppose this might be the beginning of the recession in worldwide. [Ja] いやー、ついにきました。今回はマジホンモノだ。 Fed による 0.5 % の緊急利下げです(FF rate ではなく公定歩合ですが)。 1987 年のブラックマンデー、1998 年の LTCM[1] 破綻よりもひどいと言われる今回の subprime lendingContinue reading “Fed Cuts Discount Rate, Recognizing Need to Stem Credit Crisis”


http://min-caml.sourceforge.net/index7.html http://min-caml.sourceforge.net/paper.pdf (tech paper) [En] Min-Caml is a simple, small, clean and efficient compiler for minimal ML language. It is composed of just 2k lines, but many compiler features are included. Quite nice! Min-Caml is implemented by ocaml, thus studying Min-Caml’s code is much useful for me to implemente my MUDA language compiler(since MUDA compilerContinue reading “Min-Caml”