初心者向けDataRobot Auto MLチュートリアル2022 | 機械学習

Find AI Tools
No difficulty
No complicated process
Find ai tools

初心者向けDataRobot Auto MLチュートリアル2022 | 機械学習

目次

はじめに

DataRobotはオートマチックな機械学習プラットフォームです。このチュートリアルでは、DataRobotを使用して特徴量リストの作成、機械学習モデルのトレーニング、モデルのパフォーマンス評価、予測の作成方法について説明します。

データの準備

まず、モデリング用のデータを準備します(オプション)。このチュートリアルでは、s k learnから取得した乳がんデータセットを使用します。ノートブックに従って、トレーニングデータセットとテストデータセットをCSVファイルとしてエクスポートすることができます。または、独自のデータセットを使用する場合は、チュートリアルに従って操作を行ってください。乳がんデータセットは2値分類モデル用のデータセットですので、チュートリアルをステップバイステップで進める場合は、バイナリラベルを持つデータセットの使用をお勧めします。

...

...

...

モデルの評価

モデルの評価情報はEvaluateタブにあります。Evaluateタブの中にはLift Chart、ROC Curve、Confusion Matrixなどの情報が含まれています。Lift Chartタブでは、予測値と実際の値の両方についてlift chartがプロットされています。また、データ選択、ビン数、並べ替え、ドリルダウンの有効化などのオプションもあります。ROC Curveタブでは、予測分布、ROC曲線、混同行列、およびモデルのパフォーマンス指標が表示されます。Confusion MatrixとPayoff Matrixタブでは、混同行列に利益を追加することができます。Payoffを追加した後、混同行列のカウントの横に利益が表示されます。Model Performance Metricsタブでは、モデルのパフォーマンスメトリクスが表示されます。デフォルトでは、F1スコア、真陽性率(感度)、陽性的中値(適合率)が表示されますが、表示するメトリクスを選択することもできます。

モデルの選択

モデル比較の結果を考慮し、クロスバリデーションとホールドアウトデータセットでのパフォーマンスが優れているため、ニューラルネットワークモデルを選択することにしました。テストデータセットは小さいため、予測時間の長さは問題ありません。

予測の作成

Models → Leaderboardの順にクリックし、ニューラルネットワークモデルの名前をクリックします。展開されたセクションで「Predict」をクリックします。テスト予測の下に表示されるPrediction thresholdをカスタマイズすることができます。オレンジ色の「Choose file」をクリックしてファイルをアップロードします。ローカルコンピュータ、URL、データソース、またはAIカタログからファイルをアップロードすることができます。ローカルドライブからtest_data.csvファイルをアップロードした後、ファイルがPrediction Datasetsセクションに表示されます。オレンジ色の「Compute predictions」をクリックして予測を作成します。

予測のダウンロード

予測が完了したら、オレンジ色の「Download predictions」をクリックして予測結果をダウンロードします。予測結果には、行ID、予測確率、予測ラベルが含まれています。DataRobotはモデルのデプロイとモニタリングも行うことができますが、このチュートリアルではオートMLに焦点を当てているため、デプロイとMLOpsについては説明しません。

Most people like

Are you spending too much time looking for ai tools?
App rating
4.9
AI Tools
100k+
Trusted Users
5000+
WHY YOU SHOULD CHOOSE TOOLIFY

TOOLIFY is the best ai tool source.