このセクションの他の記事
- サービスとは
- サービス管理画面
- 新規サービスを追加(学習)
- 新規サービスを追加(推論)
- 新規サービスを追加(プロジェクト管理)
- 新規サービスを追加(最適化)
- サービスの詳細と実行コードの作成(推論)
- サービスの詳細と実行コードの作成(学習)
- サービスの詳細と実行コードの作成(プロジェクト管理)
- サービスの詳細と実行コードの作成(最適化)
- サービスの編集
- サービス使用状況を表示
- APIの共通仕様
- APIの返り値(数値データ/文書データ(csv)の分類)
- APIの返り値(回帰)
- APIの返り値(画像の分類、ベクトル化、次元圧縮)
- APIの返り値(文書データ(zip/txt/pdf)の分類、ベク…
- APIの返り値(時系列解析)
- APIの返り値(学習)
- APIの返り値(最適化)
推論APIの返り値(数値データ/文書データ(csv)の分類)
数値データ、または文章を含む構造化データの分類問題を APIで推論した際のレスポンス(返り値)です。
出力される項目の解説は、推論結果の見方 をご覧ください。
<補足>「構造化データ」をごく簡単に説明すると、行と列で構成される整形されたデータのことです。データを列ごとに意味を持たせて格納するため「構造化」していると考えます。
本ページは、このようなデータをカンマ区切りのCSV(Comma Separated Value)形式で投入する場合の解説です。
■対象のレシピと投入データ/ファイル形式
<レシピ>
・AutoFlowの分類、またはブロックタイプ「分類」の中のいずれかを使っている
<投入データ/ファイル形式>
・数値データ/csvファイル
学習に使用する列、予測する列どちらも数値のデータ
・文章や単語など(=自然言語)を含む文書データ/csvファイル
文章を分かち書きするなど自然言語処理を行ってから分類を行うAIモデルを想定しています。
非構造化データの zip, txt, pdfファイルを投入するケースとの違いは、構造化データのためデータセットのいずれかの列が正解ラベルである点です。
※非構造化データの zip, txt, pdfファイルを投入する場合のレスポンスは異なります。
■レスポンスのデータ形式
項目 | 値と説明 |
---|---|
MIMEタイプ | application/json |
文字コード | Unicode(UTF-8) |
■レスポンスの値
フィールドの出力順は実行環境によって異なります。
フィールド_0 | フィールド_1 | 説明 |
---|---|---|
action | 固定値 “finishInferring” 推論の終了を意味する |
|
inferenceType | 固定値 “classficationStructuredData” 推論のタイプが構造化データの分類であることを意味する |
|
id | MatrixFlow内部で自動で付与する実行時の識別ID | |
inputColumns | AIを作成する際に指定した「学習に使用する列名」(=説明変数):配列 | |
predictionColumn | AIを作成する際に指定した「予測する列名」(=目的変数) | |
classes | 分類するクラスを示す値:配列 例)0, 1, 2 の3クラスに分類する場合 [0, 1, 2] |
|
probability | true / false 次項 “list.クラス名_probability”が算出されるか否か |
|
list | 投入したデータセットの行ごとに、以下4つの情報を繰り返し出力する | |
“列名”: 入力した値 | 投入した値をカンマ区切りで列数分(列が3列あれば、3列分の列名とその値) MatrixFlowで推論を行ったときの、推論結果画面の右側に該当 推論結果画面は[学習に使用した列]と[その値]のみだが、ここには投入したすべての列を出力する |
|
“予測する列名”: 予測結果 | 予測したクラス 予測結果は、”classes” のいずれかの値 行ごとの推論結果詳細画面の上部[推論結果]に該当 |
|
“クラス名_probability”: 各クラスの信頼度 | 予測した分類クラスがそのクラスにどれだけ当てはまるか(1.0に近いほど当てはまりが良い) 推論結果詳細画面の[信頼度詳細]に該当 |
|
“列名_importance”: 列の重要度 | “feature_importance.shap_values” の小数第四位を四捨五入した値 推論結果詳細画面の[推論結果に与えた影響度]に該当 |
|
total | 予測した行数(=投入した推論データの行数) | |
feature_importance | shap_values | 各説明変数の重要度(行ごと):配列 “list.列名_importance” と重複するが、投入したすべての行の四捨五入する前の値 前処理でOne-Hotエンコーディングやダミーコーディングを行って複数列になった列も1列に戻して計算される |
x_test | 各説明変数の重要度の分布(行ごと):配列 各列の実際の値 |
|
input_columns | すべての説明変数の列名:配列 | |
mean_shap | “列名”: 推論結果全体における列の重要度 | 推論結果全体に対する各説明変数の重要度:配列 推論結果画面の右上[重要度を表示]で確認できる値に該当 |