外れ値の削除

2025-02-26-161705

機械学習における「外れ値」とは、データセットの他のデータポイントと比べて極端に異なる値のことを指します。外れ値は、ノイズや異常値の可能性があり、モデルの学習に悪影響を及ぼすことがあります。

前処理では、外れ値の対処方法の一つである「外れ値の削除」が行えます。

■使い方

2025-02-27-150210

1.前処理したいデータセットを選択し、前処理に移動します。外れ値を表示するために、外れ値や統計情報を表示スイッチをクリックします。

2025-02-27-150222

2.外れ値のある列は緑文字で表示されます。外れ値のある列にカーソルを合わせ、虫眼鏡のアイコンをクリックして詳細画面に移動します。(今回は平均部屋数の列を選択します)

2025-02-27-150234

3.箱ひげ図を表示すると、緑点の部分が外れ値です。

2025-02-27-150242

4.リストから外れ値を除去するをクリック

5.外れ値を除去するボタンをクリックします。

2025-02-27-150248

6.外れ値が除去され、箱ひげ図の緑点がなくなったことが確認できます。