総合情報サイト / マニュアル / サービス管理 / APIの返り値(数値データ/文書データ(csv)の分類)

推論APIの返り値(数値データ/文書データ(csv)の分類)

数値データ、または文章を含む構造化データの分類問題を APIで推論した際のレスポンス(返り値)です。

出力される項目の解説は、推論結果の見方 をご覧ください。

<補足>「構造化データ」をごく簡単に説明すると、行と列で構成される整形されたデータのことです。データを列ごとに意味を持たせて格納するため「構造化」していると考えます。
本ページは、このようなデータをカンマ区切りのCSV(Comma Separated Value)形式で投入する場合の解説です。

■対象のレシピと投入データ/ファイル形式

<レシピ>

・AutoFlowの分類、またはブロックタイプ「分類」の中のいずれかを使っている

<投入データ/ファイル形式>

・数値データ/csvファイル
学習に使用する列、予測する列どちらも数値のデータ

・文章や単語など(=自然言語)を含む文書データ/csvファイル
文章を分かち書きするなど自然言語処理を行ってから分類を行うAIモデルを想定しています。
非構造化データの zip, txt, pdfファイルを投入するケースとの違いは、構造化データのためデータセットのいずれかの列が正解ラベルである点です。
※非構造化データの zip, txt, pdfファイルを投入する場合のレスポンスは異なります。

■レスポンスのデータ形式

項目 値と説明
MIMEタイプ application/json
文字コード Unicode(UTF-8)

■レスポンスの値

フィールドの出力順は実行環境によって異なります。

フィールド_0 フィールド_1 説明
action   固定値 “finishInferring”
推論の終了を意味する
inferenceType 固定値 “classficationStructuredData”
推論のタイプが構造化データの分類であることを意味する
id MatrixFlow内部で自動で付与する実行時の識別ID
inputColumns AIを作成する際に指定した「学習に使用する列名」(=説明変数):配列
predictionColumn AIを作成する際に指定した「予測する列名」(=目的変数)
classes 分類するクラスを示す値:配列
例)0, 1, 2 の3クラスに分類する場合 [0, 1, 2]
probability true / false
次項 “list.クラス名_probability”が算出されるか否か
list 投入したデータセットの行ごとに、以下4つの情報を繰り返し出力する
“列名”: 入力した値 投入した値をカンマ区切りで列数分(列が3列あれば、3列分の列名とその値)
MatrixFlowで推論を行ったときの、推論結果画面の右側に該当
推論結果画面は[学習に使用した列]と[その値]のみだが、ここには投入したすべての列を出力する
“予測する列名”: 予測結果 予測したクラス
予測結果は、”classes” のいずれかの値
行ごとの推論結果詳細画面の上部[推論結果]に該当
“クラス名_probability”: 各クラスの信頼度 予測した分類クラスがそのクラスにどれだけ当てはまるか(1.0に近いほど当てはまりが良い)
推論結果詳細画面の[信頼度詳細]に該当
“列名_importance”: 列の重要度 “feature_importance.shap_values” の小数第四位を四捨五入した値
推論結果詳細画面の[推論結果に与えた影響度]に該当
total 予測した行数(=投入した推論データの行数)
feature_importance shap_values 各説明変数の重要度(行ごと):配列
“list.列名_importance” と重複するが、投入したすべての行の四捨五入する前の値
前処理でOne-Hotエンコーディングやダミーコーディングを行って複数列になった列も1列に戻して計算される
x_test 各説明変数の重要度の分布(行ごと):配列
各列の実際の値
input_columns すべての説明変数の列名:配列
mean_shap “列名”: 推論結果全体における列の重要度 推論結果全体に対する各説明変数の重要度:配列
推論結果画面の右上[重要度を表示]で確認できる値に該当