データ解析における特徴選択
Vol.104 No.3pp.221-227
発行日:2021/03/01
Online ISSN:2188-2355
Print ISSN:0913-5693
種別:小特集 データサイエンスにおけるデータ抽象化によるデータ理解へのアプローチ
専門分野:
キーワード:
特徴, 特徴選択, 教師あり学習, 教師なし学習,
本文:PDF(781.7KB)>>
あらまし:
機械学習で取り扱われるデータは,値のベクトルで与えられることが一般的であり,ベクトルの次元を特徴と呼ぶ.特徴選択は,分析の目的に照らして,意味のある特徴を選択するための技術であり,情報理論・統計を手段として用いる.特徴選択は,機械学習における古典的な難問の一つであり,分析の目的が最初に与えられている教師あり学習ではNP-困難であり,教師なし学習では解が一意に定まらない本質的な多義性が難問であるゆえんである.ビッグデータ分析では,膨大な情報雑音を除去する必要があり,重要な技術である.