医療画像解析のための3Dミックスプレシジョントレーニング
目次:
- 医療画像解析とは
- 3D医療画像セグメンテーションの概要
- 3Dユニットモデルの構造
- 訓練データセットの概要
- パッチベースの訓練とオプティマイザの設定
- 訓練パフォーマンスの比較
- AMPの効果:トレーニング時間の短縮
- AMPの効果:GPUメモリの削減
- MPを活用したTrainingの利点
- 研究結果のまとめ
医療画像解析のための3Dミックスプレシジョントレーニング
医療画像解析は、CTやMRI、超音波などのさまざまな医療画像から高度な理解を得ることを目指すものです。医療画像解析の主な目的は、解剖学的な理解、疾患の診断、治療計画、手術のガイダンスなどです。最近では、医療画像解析の技術を使用してコロナウイルスのスクリーニングを試みる研究者もいます。
ここでは、特定のアプリケーションとして、3D医療画像セグメンテーションについて話します。私たちはCTやMRIなどの3Dボリュームを入力として提供し、左側の図に示されるように、肝臓や脾臓などの3D構造を抽出しようとします。また、右側では、セグメンテーションのレンダリング結果を表示します。
3Dミックスプレシジョントレーニングには、3Dユニットモデルを使用します。これは、畳み込みエンコーダ、デコーダ、エンコーダとデコーダの間のスキップ接続など、いくつかのコンポーネントを含んだものです。Uシェイプの設計により、エンドツーエンドのトレーニングと推論が可能になり、画像セグメンテーションに効率的かつ効果的なイメージからイメージへの変換が可能です。
私たちは、訓練にPyTorch 1.6.0を使用し、32ギガバイトのTesla V100 GPUで実験を行いました。医療画像は通常、非常に大きなサイズであるため、私たちはパッチベースのトレーニングを選択しました。つまり、生の画像からキューブを切り出し、キューブのサイズは128キューブまたは160キューブとすることができます。ミニバッチのサイズは2、4、または8などで構成されます。最適化手法はAdamを使用し、学習率は一定です。
訓練のパフォーマンスを評価するためには、ダイススコアを使用します。ダイススコアは、予測と正解データとの間の距離を測定するものです。ダイス損失は、ソフトマックス後の確率を考慮したダイススコアの修正バージョンです。
私たちは、左心房セグメンテーションの訓練パフォーマンスを示します。自動ミックスプレシジョン(AMP)を使用するトレーニング事例とAMPを使用しないトレーニング事例のトレーニングロスカーブを比較しています。左側の図では、トレーニングロスカーブがほぼ同一であることがわかります。また、右側の図では、AMPを使用したトレーニングの方がトレーニング時間が半分になることがわかります。
同様に、3D CTの脾臓セグメンテーションのトレーニングパフォーマンスも比較しました。トレーニングロスカーブはほぼ同じであり、AMPを使用したトレーニングの方がトレーニング時間が大幅に短縮されます。
この研究では、AMPを使用したトレーニングの効果について詳しく調査しました。AMPを使用することで、トレーニング時間が短縮されるだけでなく、GPUメモリの消費も減らすことができます。AMPを利用したトレーニングにより、より大きな3Dモデルをトレーニングすることが可能になり、より高い精度を実現することができます。