solutions
既存の線量計算プログラムに対してポーティングを行い、GPUを用いた並列高速化を実現します。
※1 original : Intel® Core™ i7 6Core OpenMP
共有メモリを使用することにより、分岐を軽減します。 ⇒ 4~8倍程度の効果
並列度を上げるためにループ統合します。 ワーク変数(レジスタ)を利用して、不必要なアトミック演算を減らします。 ⇒ 高速化を実現