Skip to content

Commit

Permalink
Copy Files From Source Repo (2023-11-10 17:29)
Browse files Browse the repository at this point in the history
  • Loading branch information
olprod committed Nov 11, 2023
1 parent a45642e commit fa525e6
Show file tree
Hide file tree
Showing 2 changed files with 50 additions and 45 deletions.
59 changes: 32 additions & 27 deletions Instructions/05-Designer-train-model.md
Original file line number Diff line number Diff line change
Expand Up @@ -15,7 +15,7 @@ Azure Machine Learning デザイナーには、ワークフローを定義でき

## Azure Machine Learning ワークスペースをプロビジョニングする

Azure Machine Learning ''ワークスペース'' では、モデルのトレーニングと管理に必要なすべてのリソースと資産を管理するための中心的な場所が提供されます。** Azure Machine Learning ワークスペースは、スタジオ、Python SDK、Azure CLI を使用して操作できます。
Azure Machine Learning ''ワークスペース'' では、モデルのトレーニングと管理に必要なすべてのリソースと資産を管理するための中心的な場所が提供されます。** Azure Machine Learning ワークスペースは、スタジオ、Python SDK、Azure CLI を使用して操作できます。

Azure CLI を使用してワークスペースと必要なリソースをプロビジョニングする、シェル スクリプトを使用します。 次に、Azure Machine Learning スタジオのデザイナーを使用して、モデルのトレーニングと比較を行います。

Expand All @@ -25,7 +25,7 @@ Azure Machine Learning ワークスペースとコンピューティング ク

1. ブラウザーで、Azure portal (`https://portal.azure.com/`) を開き、Microsoft アカウントでサインインします。
1. ページ上部の検索ボックスの右側にある \[>_] (*Cloud Shell*) ボタンを選びます。 これにより、ポータルの下部に Cloud Shell ペインが開きます。
1. メッセージが表示されたら、 **[Bash]** を選択します。 Cloud Shell を初めて開いたときに、使用するシェルの種類 (*Bash* または *PowerShell*) を選択するように求められます。
1. メッセージが表示されたら、 **[Bash]** を選択します。 Cloud Shell を初めて開いたときに、使用するシェルの種類 (*Bash* または *PowerShell*) を選択するように求められます。
1. Cloud Shell のストレージを作成するように求められた場合は、正しいサブスクリプションが指定されていることを確認して、 **[ストレージの作成]** を選択します。 ストレージが作成されるまで待ちます。
1. ターミナルで、次のコマンドを入力して、このリポジトリをクローンします。

Expand All @@ -34,7 +34,7 @@ Azure Machine Learning ワークスペースとコンピューティング ク
git clone https://github.com/MicrosoftLearning/mslearn-azure-ml.git azure-ml-labs
```
> コピーしたコードを Cloud Shell に貼り付けるには、`SHIFT + INSERT` を使用します。
> コピーしたコードを Cloud Shell に貼り付けるには、`SHIFT + INSERT` を使用します。
1. リポジトリがクローンされたら、次のコマンドを入力してこのラボ用のフォルダーに移動し、そこに含まれている setup.sh スクリプトを実行します。
Expand All @@ -43,25 +43,26 @@ Azure Machine Learning ワークスペースとコンピューティング ク
./setup.sh
```
> 拡張機能がインストールされていないことを示す (エラー) メッセージは無視します。
> 拡張機能がインストールされていないことを示す (エラー) メッセージは無視します。
1. スクリプトが完了するまで待ちます。通常、約 5 分から 10 分かかります。
1. スクリプトが完了するまで待ちます。通常、約 5 分から 10 分かかります。
## 新しいパイプラインを構成する
ワークスペースと必要なコンピューティング クラスターを作成したら、Azure Machine Learning スタジオを開き、デザイナーでトレーニング パイプラインを作成できます。
ワークスペースと必要なコンピューティング クラスターを作成したら、Azure Machine Learning スタジオを開き、デザイナーでトレーニング パイプラインを作成できます。
1. Azure portal で**mlw-dp100-labs** という名前の Azure Machine Learning ワークスペースに移動します。
1. Azure portal で **mlw-dp100-...** という名前の Azure Machine Learning ワークスペースに移動します。
1. Azure Machine Learning ワークスペースを選択し、その **[概要]** ページで **[スタジオの起動]** を選択します。 ブラウザーで別のタブが開き、Azure Machine Learning スタジオが開きます。
1. スタジオに表示されるすべてのポップアップを閉じます。
1. Azure Machine Learning スタジオ内で、 **[コンピューティング]** ページに移動し、前のセクションで作成したコンピューティング クラスターが存在することを確認します。 クラスターはアイドル状態で、実行されているノードは 0 個のはずです。
1. **[デザイナー]** ページに移動します。
1. ページの上部にある **[カスタム]** タブを選びます。
1. カスタム コンポーネントを使用して新しい空のパイプラインを作成します。
1. 既定のパイプライン名 (**Pipeline-Created-on-* date***) を `Train-Diabetes-Classifier` に変更するには、右側の **⚙** アイコンをクリックして **[設定]** ペインを開きます
1. パイプラインを実行するコンピューティング先を指定する必要があります。 **[設定]** ペインの、 **[コンピューティングの種類の選択]** で、 **[コンピューティング クラスター]** を選択し、 **[Azure ML コンピューティング クラスターの選択]** で **[aml-cluster]** を選択します。 [設定] ペインを閉じます。
1. 右側の鉛筆アイコンを選択して、既定のパイプライン名 (**Pipeline-Created-on-* date***) を `Train-Diabetes-Classifier` に変更します
## 新しいパイプラインを作成する
モデルをトレーニングするには、データが必要です。 データストアに格納されている任意のデータを使用することも、パブリックにアクセス可能な URL を使用することもできます。
1. 左側のメニューで **[データ]** タブを選択します。
Expand All @@ -70,32 +71,36 @@ Azure Machine Learning ワークスペースとコンピューティング ク
これでデータが用意できたので、ワークスペース内に既に存在する (セットアップ中に作成された) カスタム コンポーネントを使用してパイプラインの作成を続けることができます。
1. 左側のメニューで、 **[コンポーネント]** タブを選択します。
1. **Remove Empty Rows** コンポーネントをキャンバスの **[diabetes-folder]** の下にドラッグ アンド ドロップします。
1. **Remove Empty Rows** コンポーネントをキャンバスの **[diabetes-folder]** の下にドラッグ アンド ドロップします。
1. データの出力を新しいコンポーネントの入力に接続します。
1. **Normalize numerical columns** コンポーネントをキャンバスの **Remove Empty Rows** の下にドラッグ アンド ドロップします。
1. **[数値列の正規化]** コンポーネントをキャンバスの **[空の行の削除]** の下にドラッグ アンド ドロップします。
1. 前のコンポーネントの出力を新しいコンポーネントの入力に接続します。
1. **[デシジョン ツリー分類子モデルのトレーニング]** コンポーネントをキャンバスの **[空の行の削除]** の下にドラッグ アンド ドロップします。
1. 前のコンポーネントの出力を新しいコンポーネントの入力に接続します。
1. パイプラインを送信します。
1. 新しい実験を作成し、`diabetes-designer-pipeline` という名前を付けます。
1. **[デシジョン ツリー分類子モデルのトレーニング]** コンポーネントをキャンバスの **[数値列の正規化]** の下にドラッグ アンド ドロップします。
1. 前のコンポーネントの出力を新しいコンポーネントの入力に接続します。
1. **[構成と送信]** を選択し、 **[パイプライン ジョブのセットアップ]** ページで新しい実験を作成し、`diabetes-designer-pipeline` という名前を付け、 **[次へ]** を選択します。
1. **[入力と出力]** では何も変更せずに **[次へ]** を選択します。
1. **[ランタイムの設定]** で **[コンピューティング クラスター]** を選択し、 **[Azure ML コンピューティング クラスターを選択する]** で *aml-cluster* を選択します。
1. **[確認および送信]** を選択し、 **[送信]** を選択してパイプラインの実行を開始します。
1. **[パイプライン]** ページに移動し、**Train-Diabetes-Classifier** パイプラインを選択すると、実行の状態を確認できます。
1. すべてのコンポーネントが正常に完了するまで待ちます。
ジョブを送信すると、コンピューティング クラスターが初期化されます。 コンピューティング クラスターはそれまでアイドル状態であったため、クラスターのノード数が 0 を超えるようにサイズ変更されるまでに時間がかかる場合があります。 クラスターがサイズ変更されると、パイプラインの実行が自動的に開始されます。
1. 左側の **[送信済みジョブ]** ペインで **[ジョブの詳細]** を選択すると、パイプライン実行の状態を表示できます。
ジョブを送信すると、コンピューティング クラスターが初期化されます。 コンピューティング クラスターはそれまでアイドル状態であったため、クラスターのノード数が 0 を超えるようにサイズ変更されるまでに時間がかかる場合があります。 クラスターがサイズ変更されると、パイプラインの実行が自動的に開始されます。
各コンポーネントの実行を追跡できます。 パイプラインが失敗すると、失敗したコンポーネントと失敗した理由を調べることができます。 エラー メッセージは、ジョブの概要の **[出力 + ログ]** タブに表示されます。
各コンポーネントの実行を追跡できます。 パイプラインが失敗すると、失敗したコンポーネントと失敗した理由を調べることができます。 エラー メッセージは、ジョブの概要の **[出力 + ログ]** タブに表示されます。
## 比較する 2 つ目のモデルをトレーニングする
アルゴリズムを比較して、どちらのパフォーマンスが優れているかを評価するために、1 つのパイプライン内で 2 つのモデルをトレーニングして、比較することができます。
1. それまでに作業してきたのと同じパイプライン内にいます
1. **デザイナー**に戻り、**Train-Diabetes-Classifier** パイプラインのドラフトを選択します。
1. 他のトレーニング コンポーネントの横にあるキャンバスに **[ロジスティック回帰分類子モデルのトレーニング]** コンポーネントを追加します。
1. **Normalize numerical columns** コンポーネントの出力を、新しいトレーニング コンポーネントの入力に接続します。
1. 上部にある **[送信]** を選択します。
1. ダイアログが表示されたら、`designer-compare-classification` という名前の新しい実験を作成し、実行します。
1. パイプラインが完了したら、両方のトレーニング コンポーネントの **[メトリック]** を確認します。
1. **[数値列の正規化]** コンポーネントの出力を、新しいトレーニング コンポーネントの入力に接続します。
1. 上部にある **[構成と送信]** を選択します。
1. **[基本]** ページで、`designer-compare-classification` という名前の新しい実験を作成して実行します。
1. **[確認および送信]** を選択し、 **[送信]** を選択してパイプラインの実行を開始します。
1. **[パイプライン]** ページに移動し、**designer-compare-classification** 実験で **Train-Diabetes-Classifier** パイプラインを選択すると、実行の状態を確認できます。
1. すべてのコンポーネントが正常に完了するまで待ちます。
1. **[ジョブの概要]** を選択し、 **[メトリック]** タブを選択して、両方のトレーニング コンポーネントの結果を確認します。
1. どちらのモデルのパフォーマンスが優れているかを試して判断してください。
## Azure リソースを削除する
Expand All @@ -104,6 +109,6 @@ Azure Machine Learning を調べ終わったら、不要な Azure のコスト
1. [Azure Machine Learning スタジオ] タブを閉じて、Azure portal に戻ります。
1. Azure portal の **[ホーム]** ページで、**[リソース グループ]** を選択します。
1. **rg-dp100-labs** リソース グループを選択します。
1. リソース グループの **[概要]** ページの上部で、**[リソース グループの削除]** を選択します。
1. リソース グループ名を入力して、削除することを確認し、**[削除]** を選択します。
1. **[rg-dp100-...]** リソース グループを選択します。
1. リソース グループの **[概要]** ページの上部で、**[リソース グループの削除]** を選択します。
1. リソース グループ名を入力して、削除することを確認し、**[削除]** を選択します。
Loading

0 comments on commit fa525e6

Please sign in to comment.