データ入り口とは

2025-04-01-152631

「データ入り口」ブロックは、その名前の通りデータの入り口に配置されるブロックです。
すべてのレシピにおいて、必ずデータ入り口から開始されます。

2025-04-01-152816

1.データの種類:学習に使用するデータセットの形式によって変わります。数値・画像・テキストがあります。(対応するケースは後述)

2.テストデータ時のシャッフル:回帰学習でテストデータ分割時にデータをシャッフルするかどうかを選択できます(AI作成に関する知識のある方向けの機能です)

3.テストデータ分割時の固定:テストデータの中身を固定するかを選びます。同じデータセットを使用した際にテストデータを固定することで正常な判定がしやすくなります。(テストデータ比率を変更したり、中身が異なるデータセットを使用した場合はテストデータは変わります)

※「MFTransformerV2」は時系列用に専用の処理をしており、性質上「テストデータ時のシャッフル」や「テストデータ分割時の固定」の影響を受けません。

テストデータ入り口(数値)

CSV形式のファイルを学習に使いたいときに使用する入り口です。
パラメータは、上記に記載された通りです。

2025-04-01-154808

テストデータ入り口(画像)

ZIP形式の画像(.jpg / .png)のファイルを学習に使いたいときに使用する入り口です。

縦サイズ(横サイズ):画像を縦サイズ横サイズにリサイズします。※ファインチューニングブロックを使用した学習の場合、影響を受けません。

色次元:画像データの色によって変更する数値です。白黒まやはグレースケール画像の場合は「0」を入力してください。カラー画像の場合は「3」を入力してください。カラー画像に対して、色次元「0」を設定して実施した場合、グレースケール化して扱います。そのため、色を見ない学習をします。※ファインチューニングブロックを使用した学習の場合、影響を受けません。

標準化:各ピクセルの値を正規分布に変換し、モデルの学習や推論を安定させます。

2025-04-01-154710

テストデータ入り口(テキスト)

ZIP形式のテキスト(.text / .pdf)のファイルを学習に使いたいときに使用する入り口です。

2025-04-01-154859