このセクションの他の記事
AIの学習設定
AIモデル作成のための最後の設定画面です。
この画面で設定するのは[学習に使用する列]と[学習の詳細設定]ですが、投入するデータセットの種類によって設定項目が異なります。
データ種類 | 学習に使用する列の選択 | 学習の詳細設定 |
---|---|---|
CSV形式の表形式データ | 必須 | ・テストデータ比率 |
文書データ | 不要 | ・テストデータ比率 |
画像データ | 不要 | ・テストデータ比率 ・学習率 ・バッチサイズ ・エポック ・評価間隔(学習データ, テストデータ) |
[学習の詳細設定]については、学習の詳細設定 をご覧ください。
■[学習に使用する列]の選択
<CSV形式の表形式データ>のみ
1.データセット設定で選択したデータセットに含まれる列名の一覧です。[予測する列]に指定した以外の、前処理を行った後の列名がすべて表示されています。
この中から[学習に使用する列]にチェックをつけて選択します。
列の値が数値の場合、統計情報も表示されるので選択の参考にしましょう。
また、数値データ以外の列には朱書きで△!アイコンが表示されます。学習に使用するには、前処理の工程に戻って前処理を行いましょう。
※時系列解析(TrendFlow,MfTransformer)の場合、日付列を必ず選択します。
2.学習を開始する前に、右上の[学習の詳細設定]から[テストデータ比率]を設定します(通常デフォルト値)。
学習を開始すると、リアルタイムで学習状況を示すグラフを表示します。
■学習用データセット内のラベルの確認
<画像データと文書データ>のみ
画像データと文書データの場合、データの形状により学習に使用する列の選択はありません。
1.データセット設定で選択したデータセットに含まれるデータ数、ラベル数、クラス数を表示します。
また、上図赤枠位置の「+」「ー」で、学習用データセット内に存在する[ラベル名]とそのラベルに該当する[データ数][データ数の比率][画像のサムネイル/文書の冒頭]の表示/非表示を切り替えできます。
想定している分類クラス(=分類するカテゴリー)のラベルに過不足がないか確認しましょう。
画像のサムネイルをクリックすると拡大表示、文書の冒頭をクリックすると全文が表示されます。
2.学習を開始する前に、右上の[学習の詳細設定]から、学習の進め方に関するより詳しい設定をします(通常デフォルト値)。
学習を開始すると、リアルタイムで学習状況を示すグラフを表示します。
■MFTransformerV2の学習設定について
<MFTransformerV2>のみ
MFTransformerV2を使用する場合、専用の学習画面が開かれます。
1.学習に使用する列に対して条件を入力するエリアです。条件の意味については後述します。
2.AIが予測する期間と、学習に利用する期間を設定します。
AIが予測する期間には、実際に予測しようと思っている期間の行数を入力します。
例えば、1日間隔のデータで7日分予測をしたいと考えている場合は「7」と入力します。
AIの学習に利用する期間には、予測をしたいと考えている「7日分」に対して、影響を与えそうな期間を入力します。
まずは2倍程度の数値(この場合は「14」)を入力し、学習をお試しください。
<思ったような結果にならない場合>
数字を「28(+14(倍))」「31(一ヶ月分)」と増やして検証を繰り返して求めるAIを作ります。
それでも思ったような結果にならない場合には、予測の列に関連のある列をデータセットに加える等、データセットの内容について再考を行う必要もあります。
「AIの学習に利用する期間」の詳しい説明は、MFtransformerV2の「AIの学習に利用する期間」説明資料 をご覧ください。
3.設定した条件から該当の列が一覧で表示されます。
表示するには、学習に使用する列の設定にある「設定値の詳細を表示する」のスイッチをONにする必要があります)
学習に使用する列に設定する条件について
1.予測する列に設定できる値か
予測する際に「予測用のデータセット」を用意しますが、予測用のデータセットの「予測する期間の行に予めデータを記入できるか」で判断をします。
例えば「この日にセールを実施する」等、人の考えで先の予定がたてられるものは、予測する期間にも予めデータを入れる事ができますので「予測時に設定できる値である」と言えます。
2.時間で変化するか
時間の経過で変動する値化どうかを設定します。
変化するものの例として、天気やプロモーションを実施したかどうか等が当てはまります。
一方、変化しないものとして、商品のカテゴリーなど固定の値や、顧客IDなど行を特定するためのデータなど、予測する列と関連しない列が当てはまります。
また、短期間の人口変化など一定で大きく変化しない要素については「変化しない」(影響が軽微すぎる)と言えます。
3.データの形式
カテゴリーと数値データの2種類があります。
連続した数値か、カテゴリーを表すデータなのかを設定します。
カテゴリーデータに設定をすると、文字列のデータでも扱うことが出来ます。
この設定は自動で割り振られます。