DWHアプライアンスのユーザーデータ

DWHアプライアンスの容量の表現は分かりにくいですね。「ユーザーデータ」は、この資料の表現が分かりやすいです。
http://www.oracle.co.jp/iSeminars/090818_1500/20090818_Exadata.pdf の29ページ

Raw ストレージ: データ総容量(ディスク本数x ディスク容量)
ユーザデータ: アプリケーションが使用できるデータ量。ミラーリング後temp, logs, undo, index
等の容量を差し引いている。ユーザデータはcompressなしで算出。Compress が有効になれば
2-4倍のデータ量が格納可能です(実際のデータ量はアプリケーションにより異なります。)

ここで「Raw ストレージ」と表現されている容量はストレージシステム側の「ディスク本数x ディスク容量」(物理容量)であってSMPホスト側(データ処理サーバー側)は含みません。なお、スペア用のディスクを含んでいることがあります。
「ユーザーデータ」は、論理容量に計算しなおして(TB表示なら1.024の4乗で割る→約90%)、ミラーリングで半分(→45%)、その他各種領域(一時領域、ログ領域、インデックス領域)を3分の1くらい減らして、残るのはだいたい30%くらいです。


例えば
・Exadata V2 用「Sun Oracle Exadata Storage Server」(SAS-600G*12)1台あたり:物理7.2TB、ユーザーデータ2.0TB(約27.8%)
・Exadata V2 用「Sun Oracle Exadata Storage Server」(SATA-2T*12)1台あたり:物理24.0TB、ユーザーデータ7.0TB(約29.2%)
・Exadata V1 用「HP Oracle Exadata Storage Server」(SAS-450G*12)1台あたり:物理5.4TB、ユーザーデータ1.5TB(約27.8%)
・Exadata V1 用「HP Oracle Exadata Storage Server」(SATA-1T*12)1台あたり:物理12.0TB、ユーザーデータ3.3TB(約27.5%)
・Twinfin 用「S-Blade」(SAS-450G*8)1台あたり:物理3.6TB、ユーザーデータ0.83TB(約25.3%)
・Twinfin 用「S-Blade」(SATA-1T*8)1台あたり:物理8.0TB、ユーザーデータ2.67TB(約33.0%)
少し構成が違いますが
SQL Server Fast Track Data Warehouse の HP ProLiant DL385 G5p モデル(SAS-300G*20):物理6.0TB、ユーザーデータ1.6TB(約30.0%)


この比率には正確な根拠はなく、だいたいの数値のはずです。相互比較する場合は「ユーザーデータ」ではなく「物理容量」同士で行ったほうがよいかもしれません(ただしスペア分を除いてから)。なお、これからさらにデータ圧縮の倍率を考慮する必要があります。
価格についても「ユーザーデータ1TBあたり」で比較されることが多いので、「ユーザーデータ」の意味を理解しておく必要があります。


(追記)
Exadata V1 で DWH を構築したソフトバンク社の例
http://itpro.nikkeibp.co.jp/article/NEWS/20090714/333862/

Exadataのストレージ容量は物理容量が約336T(テラ)バイト、ユーザー領域が約92Tバイト。

物理336TB、ユーザーデータ92TB(約27.4%)