このセクションの他の記事
学習とは
AIモデルで予測を行うには、事前に「学習」を行い、AIモデルを作成する必要があります。
「学習」は、AIモデルの作成に必須の工程で、既存のデータを空のAIモデルに読み込んで解析し、課題を解決するのに最適なアルゴリズムやパラメータを決定します。
MatrixFlowでは、「AIモデルの設計→学習→アルゴリズムやパラメータの決定」をコードを書かずに、[レシピ]と呼ぶAIモデルの設計図と学習用に用意したこれまでに蓄積したデータを使って、高精度のAIモデルの作成を実現します。
学習を行ったAIモデルは[学習済みAI]といい、推論用のデータを推論できるようになります。
■学習の仕組み
学習用のデータは、読み込んだ後システム内で「訓練データ」と「テストデータ」の2つに分けて使います。
すべてのデータを学習に使うのではなく、「訓練データ」でアルゴリズムやパラメータの最適な組み合わせを探索しながら学習を行い、「テストデータ」で探索したパラメータでのAIモデルの予測精度を確認しています。
初めてAIに触れる方には少々複雑な話になりますが、精度評価の値について でより詳しく説明しています。
■学習に使える変数とは?
機械学習では、「目的変数」や「説明変数」という言葉をよく目にします。
「目的変数」は、AIモデルに予測してほしい項目のことで、[予測する列]を指します。
「説明変数」は「特徴量」とも呼びますが、目的変数を成立させる(=説明する)複数の項目のことで、[学習や推論に使う列]を指します。
いろいろな項目の組み合わせによって目的変数が成り立っているので、目的変数を説明する変数ということです。
AIモデルが学習したり、予測したりできるデータは数値のみです。画像ファイルや文書データの分類予測もできますが、それらのデータも内部で数値化しています。
CSV形式の表形式データを投入する場合、グループ化できる単語(男,女など)は前処理で、それ以外の文章などは自然言語処理で数値に変換します。いずれもMatrixFlow内で可能です。