Radeon HD 5870 has 544 DP GFlops

(via twitter) http://pc.watch.impress.co.jp/img/pcw/docs/317/309/html/kaigai12.jpg.html – double 精度で 544 Gflops(およそ  Core i7 の 10 倍) – IEEE754-2008 互換 Spec を見る限りでは、「おぉ、ブラボー!」 GPGPU による、lucille のようなオフラインレイトレレンダラのアクセラレーションに本格的に使えそうです. CPU での演算と比べて GPU で計算させても double 精度でも誤差が発生せず、 (double 精度でもきちんと IEEE754 互換であれば) かつ CPU の 10 倍ほどの(理論ピークでの比較ですが)浮動小数点パフォーマンスがあるわけですから、 オフラインレンダラのような精度が求められつつも高速化したいというアプリに向いていると思います. shared memory も GeForce より多いサイズを積んでいるようなので, たとえば CUDA ベースのレイトレカーネルも Radeon HD 5870 で問題なく動きそう. ただ、ATI はどちからというと既存グラフィックス性能重視、NV は汎用演算重視らしいので、 CUDA レイトレのように比較的分岐やランダムアクセスが多いカーネルは、 もしかしたら RadeonContinue reading “Radeon HD 5870 has 544 DP GFlops”

World’s first SIMD ray-triangle intersection with ARM/NEON

I’ve wrote possibly world’s first SIMD ray-triangle intersection code with ARM/NEON instruction. The code runs finely on iPod touch 3G(ARM Cortex) and iPhone 3GS. The performance on iPod touch 3G is around 348 cycles per isect4(). # of assembly instruction of isect4() is around 140, thus the CPI = 348/140 = 2.48, which is notContinue reading “World’s first SIMD ray-triangle intersection with ARM/NEON”

[Google groups] SIMD-cafe for SIMD lovers

なぜ SIMD が重要か プロセッサのクロック数は頭打ち… マルチコア化ではコアが増えるたびにコア間の通信がネックになる問題がある. 専用プロセッサを作るにも, 固定したアルゴリズム&量が出ないとビジネスにならないので, やはり CPU 的にソフトなプロセッサが求められる. 一方で、エコ時代であるので省電力が求められる. そんな HW の制約の中で、SW(アプリ)は富豪的プログラミングで HW の向上に頼るだけでは対応しきれなくなってきています. 特に認識処理、グラフィックス、データベース処理でパフォーマンスを出していくことが求められている. このような、現在のプロセッサ(半導体)の技術的壁やプロセッサデザインの収益モデル(ビジネスモデル)を考えると、 特に SIMD 演算器とその活用が重要になってきます. 実際, x86/AVX(wider SIMD), iPhone 3GS(ARM/NEON), Atom/SSE が登場してきています. アプリを SIMD 最適化する必要性は今後また重要になってくるでしょう. (SIMD 最適化の最初のブームは、 MMX/SSE/SSE2 の出てきた 2000 年頃でしょうか) しかし、どんなにコンパイラが賢くても、効率的な SIMD コードを自動で吐いてくれるのはまだまだ難しい. そこで、プログラマがいかにアルゴリズムを SIMD フレンドリーにするか、 SIMD 演算器をいかにまく使ってプログラムを最適化していくかが、 今また大きく求められている、そんな気がしています. また、ときどき SIMD 野郎と話すことがあるのですが、 結構みんな「ほかに SIMD のことを濃く話すことができるひとが居なくて…」 と言われることもあり, SIMD 野郎のための googleContinue reading “[Google groups] SIMD-cafe for SIMD lovers”

The effect of importance sampling

In this post, I’d like to let you know the power of importance sampling. First of all, see the images rendered with importance sampling and without importance sampling when choosing random ray direction. (Path tracer with importance sampling) (Path tracer without importance sampling) Both use same the number of samples per pixel, thus the renderingContinue reading “The effect of importance sampling”

Caustic Graphics ray traced global illumination demonstration

(via Twitter) Caustic Graphics ray traced global illumination demonstration http://www.pcper.com/comments.php?nid=7801 おー、Caustic でパストレっぽいこともできるのね. ただ、パフォーマンスはちょっと微妙な感じ. 2M ~ 10M rays/sec くらいという感じかな. ただ、実際の製品のパフォーマンスの 1/10~1/20 と言われている FPGA で動かしてこのレベルということであれば、まあ妥当な数字かもしれません. しかし相変わらずいつもビデオでデモしているときの場所が大学の研究室っぽいのはなにか狙っているのだろうか. アジェンダが、ホワイトボードに手書きだし 🙂 でもこれで $10M くらいレイズしているんだよなー、うらやましいぜ!

Review of Cloudy: From the perspective of a renderer writer.

I’ve watch the Cloudy(Cloudy with a chance of meatballs) and I’d like to give visual impression from the perspective of a render writer. Overall, Cloudy was beautifully rendererd compared to previous motion picture Monster-house(Both used same renderer). There’s no visually recognizable Monte-carlo noises in Cloudy (noise in global illumination, noise in motion blur, etc) evenContinue reading “Review of Cloudy: From the perspective of a renderer writer.”

Watching Cloudy gathering 9/19(Sat)

せっかくなんで、某スタジオの某レンダラの出来を確認するのを裏の目的として, Cloudy(くもりときどきミートボ-ル) 鑑賞オフをしたいと思います. N 年の歳月を費やした? モーションブラーの出来はどうか!ヘアーの出来はどうか! ぜひともご確認ください. 観賞後、ご意見あれば直接某レンダラ開発チームにレポートしますんで 😉 時間と場所ですが、 9/19(土) 109シネマズ川崎 IMAX シアターになります. 残念ながらまだスケジュールは決まっていないようです。 また、インターネットからの予約も3日前からしかでません。 上映時間は夕方あたりを選択して、観賞後は(勝手に)某レンダラの出来を語る懇親会にしたいと思います. 参加希望の方は以下の URL にて、参加表明をお願いします. http://atnd.org/events/1542 おまけ 109 シネマズ川崎で、ちょうど今、ダークナイトも IMAX 上映してます.

OpenCL ray-triangle intersection kernel.

I’ve wrote possibly World’s first ray-triangle intersection kernel in OpenCL. I am now working with porting full raytracing kernel(traversal, shader, isector, etc) into OpenCL. This article is just exposing the small part of my professional(?) OpenCL work to you. Here’s the sample code of ray-triangle intersection kernel in OpenCL. // // Copyright 2009 Syoyo Fujita.Continue reading “OpenCL ray-triangle intersection kernel.”

Kai-fu Lee quits Google and launch his venture fund.

http://www.reuters.com/article/technologyNews/idUSTRE5850BQ20090906 http://www.bloomberg.co.jp/apps/news?pid=90003011&sid=aiAVEbSlU7ek&refer=jp_asia お、李開復 Google 辞めてファンド作るのか。 んー、まさに私がやりたいことだなー. 私の場合: 稼いだマネーでレンダラファンド+レンダラ財団立ち上げ. 李開復の100 億円のファンドは、良い目標になるけど、 とりあえずは自分のほうは 5 億でファンド or 財団を立ち上げられないかなーと考えています. …まあまずは 5 億稼ぐネタを探すところからですかね 😉 参考資料 ビル・ゲイツ、北京に立つ http://www.amazon.co.jp/dp/4532313031 MSRA とか李開復とかあたりがいくらか書かれています. SIGGRAPH ネタもほんの少しだけどあるよ.