ビッグデータのための簡潔データ構造
Vol.97 No.5pp.379-383
発行日:2014/05/01
Online ISSN:2188-2355
Print ISSN:0913-5693
種別:特集 データを読み解く技術──ビッグデータ,e-サイエンス,潜在的ダイナミクス──
専門分野:
キーワード:
データ圧縮, 簡潔データ構造, 文字列, グラフ, ゲノムアセンブリ,
本文:PDF(501.2KB)>>
あらまし:
ビッグデータはその大きさから計算機のメモリに格納できないためディスク上に置く必要がある.ディスクはランダムアクセスが遅いため処理に制約が生じる.また,高速処理のためにはデータに索引を追加するが,そのサイズも問題になる.簡潔データ構造は,データやその索引を極限まで圧縮しつつ,様々な処理を高速に行うことができるデータ構造である.圧縮したデータをメモリに格納することで高速処理が実現できる.本稿は基本的な簡潔データ構造と,幾つかのビッグデータへの適用について解説する.