総合情報サイト / マニュアル / 予測する列の選択 / 予測する列の選択

予測する列の選択

推論時にAIに予測してほしい列(=目的変数)を設定します。
予測を導き出す材料(学習に使う列)ではなく、予測で知りたい列を選択しましょう。

これは分類や回帰問題、時系列解析を行うときに必須の設定項目で、MatrixFlowでは前ステップの「データセット設定」で表形式データ(CSVファイル)を選択した場合にのみ、設定画面に止まります。

予測する列の選択_1.png

■複数の予測する列を設定する

画面右上の[複数の予測する列を設定する]をonにすると、予測する列を複数選択できるようになります。
本機能を利用できるレシピブロックについてなど、詳細は予測する列を複数選択するをご覧ください。

■前処理後の列を使用する

[前処理]は、「予測する列」を選択する前と後、どちらかのタイミングで行います。
デフォルトは予測する列を選択した後ですが、One-Hotエンコーディングやダミーコーディングなど、施す前処理によって列名が変わる場合は、先に前処理を行います。「予測する列の選択」で、前処理によって変わった後の列名を設定する必要があるためです。

予測する列を選択する前に前処理を行うには、[前処理後の列を使用する]から[前処理後に選択する]をクリックします。詳しくは、前処理後の列を使用する をご覧ください。

また、前処理について詳しくは 学習中の前処理画面 をご覧ください。

予測する列の選択_2.png

■列名一覧を表示

データセット内の列名が一覧で表示されます。
列が多いときは検索機能を使いましょう。

予測する列の選択_3.png
  1. [列名を検索]ボックスに列名を入力する(一部でも可)
  2. [データセットの列名一覧]の表示が検索ワードでフィルターされる

[予測する列]を設定します。

予測する列の選択_4.png
  1. データセットの列名一覧から[予測する列名]をクリック
  2. [予測する列]にセットされる
  3. セットされた列名を確認し、[予測する列を決定する]をクリック

このとき、前処理が必要な列を指定するには、列名をクリックすると表示される「注意事項を確認した」をクリックすると[予測する列]に設定できます。後工程の[前処理]で必ず数値へ変換を行ってください。

予測する列の選択_5.png

■データセットを表示

データセットの内容を確認できます。

予測する列の選択_6.png

[データセットを表示]からも、予測する列をセットすることができます。
1.列をクリック
2.予測する列がセットされる

予測する列の選択_7.png

■統計情報を表示

データの統計情報を確認できます。

予測する列の選択_8.png

グラフのアイコンをクリックすると、値の個数をグラフで確認できます。

予測する列の選択_9.png
予測する列の選択_10.png

グラフにカーソルを合わせると、正確な個数が吹き出しで表示されます。
上図の場合、[生存結果]列に[0]が[549個]、[1]が[342個]あることが分かります。

[統計情報を表示]からも、列をクリックして[予測する列]をセットすることができます。

予測する列の選択_11.png