AMD OpenCL on windows too slow…?

by syoyo


I’ve wrote a simple OpenCL test program which simply fills pixels and display it through OpenGL.
When I run it on ATI Stream SDK 2.0 beta on Windows,
I got terribly slow performance: around 8 secs per frame!
(On SnowLeopard OpenCL(CPU version) it runs around 0.0001 secs per frame)

What’s wrong? Because AMD version is a beta version?
I’d like to discuss this problem but I don’t know where is the good place to ask…

FYI, Here’s OpenCL kernel used in the test program.

   __global uint *out,
   uint col) // not used.
   int x = get_global_id(0);
   int y = get_global_id(1);

   out[x+y*get_global_size(0)] = (uint)(x | (y << 8) | (255 << 16) |


単純に 256×256 画像のピクセルをフィルするだけの OpenCL プログラムを書いてみたのですが、
ATI StreamSDK 2.0 beta(Windows, CPU 利用)の OpenCL 実装だと、8 秒近くもかかってとてつもなく遅い!
(SnowLeopard だと 0.0001 秒なのに…)


Visual Studio 2008 を使っているのですが、デバッグ -> デバッグ開始だととても遅くなる模様(Release ビルドでも).
デバッグ -> デバッグなしで実行だとそれなりの速度でうごきました.
んー、なにか変な実行時デバッグチェックが、OpenCL ドライバかどうか分かりませんが、入っているのですかね.
ちなみに「デバッグなしで実行」でも、0.05 secs くらいかかりました.
(SnowLeopard の 0.0001 秒に比べるとまだ遅い)