ウォラルSDKを使用してGoogle Vertexにウォラルをデプロイしましょう
テーブルの内容:
- 概要
- ウォラルSDKのインストール
- ウォラルインスタンスへの接続
- ワークスペースの設定
- パイプラインの作成
- モデルのアップロード
- パイプラインのデプロイ
- 推論の実行方法
- ファイルを使用した推論
- APIリクエストを使用したバッチ推論
ウォラルSDKを使用したウォラルインスタンスへの接続方法
こんにちは、私はJohn Hendrickです。Wallarooのシニアテクニカルライターです。このビデオでは、Google Vertex Workbench内でWallaroo SDKを使用して、Wallarooインスタンスに接続し、トレーニング済みのMLモデルをデプロイし、シンギュラリティとバッチの推論を行う方法をご紹介します。まず、Wallarooについて簡単にご説明します。Wallarooは、MLモデルのトレーニングプラットフォーム(AWS SageMaker、Google Vertexなど)を本番環境でデプロイして、推論のモデルの競争分析などの機能を提供する、ML Opsのための最後の手段です。
ウォラルSDKのインストール
まず、ウォラルSDKをインストールします。Google VertexノートブックにウォラルSDKをインストールし、次にウォラルSDKライブラリをインポートします。その後、ウォラルインスタンスに接続するための手順を実行します。接続するためには、ウォラルのURLのプレフィックスとサフィックスを知る必要があります。この例では、サーバーのsquishy.wallabooに接続してウォルクライアントを起動します。
ワークスペースの設定
次に、ワークスペースを設定します。Wallarooでは、モデルとパイプラインを独自の環境に分割するためにワークスペースが使用されます。既存のワークスペースを選択するか、新しいワークスペースを作成するためのヘルパー関数を使用します。作成したワークスペースを変数に保存し、デフォルトのワークスペースとして設定します。
パイプラインの作成
次に、パイプラインを作成します。パイプラインは、モデルのデプロイメントメカニズムです。パイプラインは、モデルの前処理や後処理などのステップを指定することができます。この例では、詐欺を防ぐために、ウェブサイトの真贋を検出するための事前トレーニング済みのモデルを使用しています。
モデルのアップロード
モデルをワークスペースにアップロードします。モデルのアップロードコマンドを使用し、モデルの名前、ファイル名、およびモデルがテンソルフローであることを指定します。
パイプラインのデプロイ
モデルのアップロードが完了したら、パイプラインをデプロイします。デプロイには、Wallaroo環境からリソースを割り当てるために15〜45秒かかることがあります。デプロイが完了したら、パイプラインは推論のために常にデプロイされたままになります。
推論の実行方法
推論を実行する方法はいくつかあります。まず、ファイルを使用してクイックなサンプルチェックを実行します。データフレームの推論データをパイプラインに送り、結果をデータフレームとして受け取ります。次に、APIリクエストを使用してバッチ推論を実行します。
ファイルを使用した推論
ファイルを使用して推論を実行するには、ウォラルSDKのinfo_from_fileコマンドを使用します。推論データのデータフレームを指定し、結果をデータフレームとして受け取ります。
APIリクエストを使用したバッチ推論
APIリクエストを使用してバッチ推論を実行するには、推論のURLとセキュリティトークンを取得し、curlコマンドを使用してリクエストを送信します。リクエストが完了するまで結果を待ちます。
以上が、ウォラルSDKを使用したウォラルインスタンスへの接続と推論の方法です。Wallarooを使用すると、Google Vertex内でモデルのトレーニングを行い、即座にデプロイメントを行うことができます。他のテストやモデルの管理なども行うことができ、リアルタイムで実際の結果を確認することができます。
FAQ(よくある質問)
Q: ウォラルSDKをインストールするための要件はありますか?
A: ウォラルSDKをインストールするためには、Google Vertexノートブック上で作業する必要があります。
Q: パイプラインのデプロイにはどれくらいの時間がかかりますか?
A: パイプラインのデプロイには通常15〜45秒かかります。
Q: バッチ推論とファイルを使用した推論の違いは何ですか?
A: バッチ推論では、一度に多くのレコードを送信して結果を待つことができます。ファイルを使用した推論では、データフレームの形式で推論データを送信し、結果をデータフレームとして受け取ることができます。