映像/画像/CG、高速/並列化、コンテンツ管理など、映像・画像処理のメディアソリューション/コンサルティング

HOME > 高速・並列化 >  ポーティングサービス

コンサルティング/GPGPU

ソースコード解析でフルGPU化

1.初期解析(プロファイリング)

処理時間の大半を占めるホットスポットを見つける!!

オリジナルソースからプロファイル結果上位を占めるサブルーチンを図示→自社ツールで図示化!
2.並列化検討

ホットスポット部分のループ依存、タスク依存を変数参照によってチェック

結果から並列化のためのアルゴリズム再考箇所をご提示→自社ツールで図示化!
3.カーネル分割設計

データサイズ、転送量からカーネル分割

自社ツールで表作成!
4.並列コード作成

アルゴリズム再考、ループ結合でGPUのための並列化コード作成
⇒ 成果予測提示

5.実装⇔チューニング

プロファイラ等でチェックしながら、さらなる最適化を実施

事例紹介

大気放射伝達計算
特徴
26,000ステップのフルGPU化、大規模メモリ負荷が大きい
言語
CUDA Fortran
成果
Tesla C2050で6倍 ※
詳細
こちら
ガス濃度算出計算
特徴
並列数が少ない
言語
CUDA Fortran
成果
Tesla C2050で1.6倍 ※
分子動力学計算
特徴
ループにデータ依存がある
言語
CUDA Fortran
成果
Tesla C2050で3.8倍(vs CPU 4Core)
詳細
こちら
モンテカルロ法線量計算
特徴
乱数による計算のため分岐が多い
言語
CUDA C
成果
Tesla K20cで13倍(vs CPU 6Core OpenMP)
詳細
こちら
画質評価アルゴリズム
特徴
Full Referense型画質評価アプリ「MP-1000QC
言語
CUDA C
成果
Tesla C2050で32倍 ※
映像HD変換計算
特徴
リアルタイム処理の必要あり
言語
CUDA C
成果
Quadroで10倍 ※
3次元放電シミュレーション
特徴
ループにデータ依存がある
言語
CUDA C
成果
Geforceで2.7倍 ※
高潮津波計算
特徴
異なる領域計算の同期待ちが発生する
言語
CUDA Fortran
成果
TeslaK20cで6.6倍 ※
詳細
こちら
洪水氾濫計算
特徴
GPU 並列化効果を高めるために現行プログラムの修正が必須
言語
CUDA C
成果
TeslaK20cで12.8倍 ※
詳細
こちら
大気計算(物理過程計算)
特徴
GPU 並列化効果を高めるために現行プログラムの修正が必須
言語
OpenACC (Fortran)
成果
TeslaK20cで4.7倍 ※
大気乱流計算
特徴
データ依存がなく、プログラム全体に OpenACC ディレクティブ挿入可能
言語
OpenACC (Fortran)
成果
TeslaK20cで6.7倍 ※
詳細
こちら
※Intel Core™ i7と比較
  • 画質評価 評価結果を自動出力さらに自動補正も
  • コーデック MPEGに関するあらゆる操作を実現
  • Androidを含む受託開発 高い技術・豊富な経験
  • 3Dも映像も 高速・並列化 GPGPUコンピューティングで並列化
  • 多種多様なファイルを一元管理し、素早く操作・閲覧が可能 デジタルコンテンツをシンプル管理
  • お問い合わせ 評価版の貸出・資料請求・お見積