生命科学データからの組合せ発見問題
Vol.97 No.5pp.359-363
発行日:2014/05/01
Online ISSN:2188-2355
Print ISSN:0913-5693
種別:特集 データを読み解く技術──ビッグデータ,e-サイエンス,潜在的ダイナミクス──
専門分野:
キーワード:
細胞ビッグデータ, パーソナルゲノム, 多重検定, 無限次数多重検定法,
本文:PDF(729.2KB)>>
あらまし:
パーソナルゲノム時代に入り,生命科学で扱うデータは増加の一途をたどり,各個人のゲノム,エピゲノム,遺伝子発現,たん白質発現,代謝物プロファイルなどが比較的安価で得られるようになりつつある.このような細胞ビッグデータは大量であるのみならず,多様性を持つ.多様なデータ間から有用なルールを発見するためには,データマイニング手法が有効であるが,結果に関する統計的有意性が保証できないなど,生命科学に適用するには不都合な点が残っている.本稿では,生命科学にデータマイニング手法を適用する際の注意点について述べ,多重検定を考慮した組合せ要因発見手法LAMPを紹介する.