WSCG 2007

WSCG 2007 の論文も公開されていました。 というかもうカンファレンスも開かれていました… http://wscg.zcu.cz/wscg2007/wscg2007.htm まったくまだ手を付けられていませんが、タイトルからだけで判断すると、、、 Light Octree: Global Illumination Fast Reconstruction and Realtime Navigation A study of Incremental Update of Global Illumination Algorithms Robust Diffuse Final Gathering on the GPU Fast Filtering and Tone Mapping using Importance sampling あたりが面白そう 最後は、おなじみ? ブタペスト工科大の Szirmay チームです。 タイトルだけみるとシブいねぇ、まったくおたくシブいぜ。

I3D 2007 Papers list

毎度おなじみ?, Ke-Sen Huang 氏により、I3D 2007 の論文リストが公開され始めています。 http://myweb.hinet.net/home7/hks/Papers2007/i3d2007Papers.htm とりあえず軽く読んだ上での感想です。 精読していないので誤読もあると思うので参考までにとどめてください。 Multi-Fragment Effects on the GPU using the k-Buffer 各フラグメントごとに RMW(Read-Modify-Write) 可能な k 個の フラグメントバッファ(k 個のデプスなど)を持たせる。 現状 MRT(multi render target)とかあるけど、あれは書くだけしかできない。 A-buffer や R-buffer のようなもの。 半透明効果などを 1 パスで実現する。 が、これって自動(or プログラマブル)でソートできるのかな? 読む限りストリームの投入は結局ソート済みを投入するような感じで書かれているようです…. 勝ってにソートしないなら、そんなに新規性があるわけではないと思うし、 k 個に制限というのは、汎用的な処理に持っていくのには物足りない。 とはいえ、半透明処理などのグラフィックス効果には有益度が大きそうなので、 将来の GPU には搭載されそうな雰囲気です。 次世代のリアルタイムグラフィックスのキモは、 水、草木、毛、皮膚などで、いかにうるうる感、みずみずしさを表現できるかだと思いますので。 (「反射と屈折のハーモニー」っつーんですか〜、「スキャタリングの調和」っつーんですか〜) ROP に効率的かつプログラマブルな RMW を実装するのは結構コストがかかる気がしますが、 cuda では sharedContinue reading “I3D 2007 Papers list”

OpenSPW may have the chance to recieve a technical academy award in the future?

HDRI フォーマット形式である OpenEXR がアカデミー技術賞を 受賞したことを masuo さんの日記で知りました。 …. 画像フォーマットが受賞できるなら、ということは、 スペクトルデータのフォーマット形式の標準を目指す OpenSPW も いずれアカデミー技術賞を受けることも無きにしもあらず? これは早急に OpenSPW の中身の策定と実装をきちんとすべきか!?… OpenSPW: Spectrum Data format proposal

Hardware Accelerated Ambient Occlusion on GPUs

Shanmugam, P., Arikan, O., “Hardware Accelerated Ambient Occlusion Techniques on GPUs” ACM SIGGRAPH Symposium on Interactive 3D Graphics and Games. Seattle, WA, April 30 – May 2, 2007 http://www.cs.utexas.edu/~perumaal/ 動的シーン対応のアンビエントオクルージョン計算を GPU でリアルタイムにやっちゃおうという論文。 I3D 採択論文。そろそろ I3D の論文が出回り始めています。 共著者には Pixie レンダラと共に最近のアンビエントオクルージョン近似手法で 有名な Okan Arikan 氏もいます。というか I3D 三本って… http://www.cs.utexas.edu/~okan/ さて、今回の論文のアンビエントオクルージョン計算は、基本的な仕組みは非常に簡単です。 手法はイメージベースです。 カメラからまず物体を描画し、法線画像とデプス画像を作ります。 デプスが分かれば位置 P が分かりますので、各ピクセルを仮想的な球とみなすことができます。 (球の半径はデプスに比例して求めたりできる) あとは、各ピクセルにつき、周りのピクセルのその仮想球からの寄与の和をとるだけ。 欠点としては、帯域を多く使うのと、Continue reading “Hardware Accelerated Ambient Occlusion on GPUs”

NVIDIA cuda beta released

NVIDIA の cuda のベータ SDK がリリースされています。 http://developer.nvidia.com/object/cuda.html 仕組みをちらりと見てみましたが、いくらか特殊なキーワードがあるものの、 大体は C 言語の体裁に収まっていますね。 cuda のフロントエンドが、キーワードに応じて コードを GPU で処理する部分と CPU で処理する部分にまず分けて、 CPU 処理部分は通常の gcc などのコンパイラに渡される構成になっています。 オフラインレンダリングのアクセラレーションには、、、 うーんどうでしょう?どれくらいコード書き換えが必要になるのかによりますかね。 そのうち gcc などのコンパイラコードも cuda に移植して、 コンパイラを GPU で走らせコンパイルを高速化、 なんてものも出てくるかもですね。 double をサポートする GPU ところで、cuda よりも気になるものが cuda のドキュメントに書かれていました。 2007 年末には倍精度浮動小数点(double)をサポートする GPU をリリースする 予定だとのこと。 これが出てきたら、本格的に演算を cuda でアクセラレートする というのが現実的なものになってきそうですね。

64-bit Lock-free queue implementation

http://lucille.atso-net.jp/svn/angelina/algo/lock-free/ [EN] Here’s my implementation of Simon Doherty, Maurice Herlihy, Victor Luchangco and Mark Moir, Bringing practical lock-free synchronization to 64-bit applications. PODC 2004. pp. 31–39. http://www.cs.brown.edu/research/projects/transactional_memory.html — [JP] 64-bit 対応な lock-free queue を実装してみました。 この論文の特徴は、 o 64-bit 対応 o スレッド数をあらかじめ知らなくても OK (population-oblivious) o O(m+n) のメモリ領域しか使わない(m = LL/SC でアクセスが必要な変数の数, n = スレッド数) な lock-free queue アルゴリズムの提案です。これらすべてを実現するのは、この論文のアルゴリズムが初らしい。論文には疑似コードが豊富でだいたいそのまま実装もできちゃうのがいい(CASContinue reading “64-bit Lock-free queue implementation”