Quasi-Monte Carlo light transport simulation by efficient ray tracing

(from ompf.org/forum) Quite interesting and fresh thesis was published, from the author of BIH. Quasi-Monte Carlo light transport simulation by efficient ray tracing http://vts.uni-ulm.de/query/longview.meta.asp?document_id=6265 I didn’t read it yet, I have to read it soon. # but nowdays, there are a lot of papers I have to read. # 1 paper per day is absolutelyContinue reading “Quasi-Monte Carlo light transport simulation by efficient ray tracing”

Certifying floating-point implementations using Gappa

New gappa preprint was posted. Florent De Dinechin, Christoph Quirin Lauter, Guillaume Melquiond Certifying floating-point implementations using Gappa http://arxiv.org/abs/0801.0523 I’m planning to combine gappa with my MUDA language for verified and accurate floating point computation. But gappa is designed for scalar fp code, while MUDA is for vector fp code. I have to find aContinue reading “Certifying floating-point implementations using Gappa”

WaveScript(Regiment) language.

(from Lambda the Ultimate) Regiment(a.k.a WaveScript) homepage http://regiment.us/regiment_webpage/index.html WaveScript is the programming language used to develop WaveScope applications. It is a high-level, functional, stream-processing language that aims to deliver uncompromising performance. WaveScript programs execute in parallel on multiple cores, or distributed across a network. Its compiler uses aggressive partial evaluation techniques to remove abstractions andContinue reading “WaveScript(Regiment) language.”

一人で 7600 億の損失を出した男

いやー、「マネー革命」が放映された頃の 90 年代後半の金融危機よりも がぜん面白くなってきました。いや、もうすでに面白い段階だったので、さらに加速されているいう感じ。 (時は加速するというのは本当だったのか!) 仏政府は、同国金融史上最大といわれる巨額不正の全容解明を求めている http://www.afpbb.com/middle/790 一人のトレーダーが出した損失としては、 日経デリバティブで 1600億円 の損失を出してベアリングス銀行を破綻に追い込んだニック・リーソン、 住友商事のトレーダーで、銅取引で 3000 億の損失をだした浜中泰夫、 が有名どころですが、 この記録をぶっちぎって、一人のトレーダーによる損失では過去最大の記録が打ち立てられました。 さすがソジェン! 俺たちにできないことを平然とやってのける! (ベアリングスの教訓が生きていなかったとは!) 次はどこかな〜

任天堂、おまえもか!

任天堂、3Q 決算発表で、創業以来初の売り上げ 1 兆円越え、経常利益が前期比で 2 倍と過去最高になるも、 為替差損による見通し据え置きが失望されて(?)、1/28日はストップ安。 http://quote.yahoo.co.jp/q?s=7974.o&d=c&k=c3&z=m&h=on 29 日の一般教書演説で、大統領は「米経済は不透明な時期にある」と、景気減速を認めた。 http://www.yomiuri.co.jp/editorial/news/20080129-OYT1T00854.htm やっとかよ…

Fast Barrier for x86 Platforms

自動最適化で Spiral の資料をあさることが多くなっていますが、 ひとつ面白そうなネタを見つけました。 x86 での最速なバリア同期処理は何か?というもの。 Fast Barrier for x86 Platforms http://www.spiral.net/software/barrier.html まず、驚きだったのが、pthread のバリア同期関数の遅さ。 2×2 cores では 27000 cycles もかかっている。 これは CPU の周波数が 2.7 GHz なら、0.1 msec かかるということになる。ひょえ〜〜 lock + アトミック加算でのバリア同期だと、数千サイクル程度に減る。 どれもそうだけど、2×2 cores(2 dies) では、FSB をまたぐ必要があるわけで 2 cores(1 die) より遅くなるのは当然。 以外と健闘しているのが、Icc + OpenMP によるバリア同期。 ただこれはコンパイラ次第によって変わるだろうから、あまり参考にはならなそう。 で、最後に一番早いと提案されているのが、なんか独自の?配列を使った方法。 lock + アトミック加算より 2 倍くらい早くて、アセンブラを使わなくてよいという利点がある。 2 cores の時で 200Continue reading “Fast Barrier for x86 Platforms”

floating point. part 1 : 非正規化数の恐怖

浮動小数点演算(IEEE 754)のことを調べていると、 いろいろと今まで lucille などでの浮動小数点計算コードが実はダメダメで、 一から考え直す必要があることが分かってきました。 (MUDA 用の libm ももっと fp の仕組みを知ってから書き始める必要がありそう) そんなわけで、グラフィクス野郎が知っておくべき浮動小数点演算シリーズ. 第一回は、非正規化数の恐怖です。 非正規化数(denormal number, subnormal number)は、演算がアンダーフローしたときに、 いきなりアンダーフローの結果がゼロになると困るような計算のために IEEE 754 に導入されたようです。 しかし、非正規化数は、基本的にはソフトウェアで処理されるので、実はとてもパフォーマンスに影響があることが知られています。 (x86 OS では、基本的に非正規化数の扱いはデフォルトで有効になっている) アンダーフローはそんなに滅多に起こるものではない。 しかし一度起きてしまうと、アンダーフローは一気にやってくる。 一回でもアンダーフローを生じさせるような計算は、通常何度もアンダーフローを発生させるようになるからだ。 そのため、プログラムは時々アンダーフローの嵐に見舞われる。これがプログラムの実行を遅くするのだ。 W. Kahan IEEE 754R minutes from September 19, 2002 アンダーフロー(非正規化数)は通常あんまり起こらないが、 起こってしまうとずっとそれは生じてしまう、ということになる。 つまりは、今の金融市場と同じですね。 大きく指数が下落すると、ヘッジ(or 損切り)のための売りがでて、 その売りがさらに他の売りを誘発するという流動性の罠みたいな感じ。 では実際どれくらい、演算に非正規化数があると効率が悪くなるのだろう? [1] によると、非正規化数の処理のコストは 1000~ サイクルである! 世の中は広い。なんとすでに非正規化数の演算がどれくらい効率が悪いかのベンチマークプログラムが存在する [2]。 (私が一日がかりで x86 のContinue reading “floating point. part 1 : 非正規化数の恐怖”

Recent advances on motion blur rendering

Last week, I’ve talked/discussed a lot with renderists over the world about the offline renderer. After the discussion, I think we’ve confirmed that there is still a lot of things to do in (global illumination) rendering. One of it is fast & efficient computation of motion blur, this still has not been solved fully inContinue reading “Recent advances on motion blur rendering”

Parsing floating point format in Haskell + Parsec

When I tried to port simdmath library code to MUDA language, I’ve faced a problem on parsing floating point format in Haskell. Basic read function provided by Haskell Prelude cannot parse C style floating point format fully. For example, $ ghci Prelude> read “1.0” :: Double 1.0 Prelude> read “1.0f” :: Double *** Exception: Prelude.read:Continue reading “Parsing floating point format in Haskell + Parsec”

AAPL, お前もか!

Apple, 四半期決算で過去最高の売り上げと利益を達成するも、 景気減速による来期見通しが悲観され、時間外で株価 12% down とボロクソに売られた. http://itpro.nikkeibp.co.jp/article/NEWS/20080123/291756/ 現在 -17% まで売り込まれている. http://finance.google.com/finance?q=NASDAQ:AAPL USD/JPY は一時 105 円を割った… おそろしや… 円は世界最弱通貨のはずなのだが、他通貨(他国家)の健康状態があまりにもひどいので、消去法で買われている ^^)