製品情報

オブジェクトストレージObject Storage

急増するデータ、解決すべき課題

オフィスで作成・共有される各種ファイル、電子メール、写真や動画等のリッチメディア、機械間通信が生み出すログ・・・・。リレーショナル・データベース等で扱う構造化されたデータとは異なる「非構造化データ」が急増し、多くの企業は次のような課題に直面しています。

  • ひっ迫するストレージ容量と増え続けるファイル数への対応
  • 長期化するデータ保管期間(コンプライアンス含む)
  • データ量とファイル数増加によるシステム性能劣化
  • データ管理コストの増大
    • - ストレージ装置増設・置換、データバックアップ、アーカイブ、データ移行作業・・

本質的な課題解決に、オブジェクトストレージ

このような課題への暫定的な対処は、より高性能・大容量のストレージ装置に置換し、データ入れ替え作業をすることです。しかし、過去の経験を上回る速さでデータ量が増加するなか、将来に亘りこのサイクルを繰り返し続ける訳にはいきません。その本質的な解決の鍵は、GoogleやAmazonなどのクラウドが採用するIT技術、すなわち多種多様で膨大なデータ量を迅速に処理する「クラウドスケールIT」にあります。これを実現する代表的なストレージ基盤がオブジェクトストレージです。

オブジェクトストレージとは

オブジェクトストレージは、データをブロック(塊)で格納するブロックストレージや、ファイルをディレクトリーやフォルダーという階層構造で格納するファイルストレージとデータの格納方式が異なります。それぞれのファイルはオブジェクトと呼ばれ、ID(識別子)と属性情報(メタデータ)が付与され、階層のないフラットな関係として扱われます。オブジェクトストレージが、クラウドスケールに適している理由は次のとおりです。

(1)ファイルの格納場所に制約を受けない

物理的なハードディスク等の格納場所から始まる経路情報でファイルのありかを示すディレクトリやフォルダーといった階層構造は、ハードディスク容量が一杯となり、ファイルを別のハードディスクに移動すると経路情報も変更せざるをえません。ディレクトリやフォルダの数やサイズにも制限があります。フラットなオブジェクトストレージの場合には、別のハードディスクに移動したとしても、オブジェクトのID(識別子)には何ら変更がありません。このフラットな構造ゆえに、データの格納場所が分散するクラウドのような環境に最適なストレージ基盤として活用されるのです。

(2)オブジェクト単位のIDとシンプルな通信プロトコル

オブジェクトストレージは、オブジェクト単位のID(識別子)が付与されます。このID情報だけで該当するファイルに直接到達できるため、階層のある長い経路をたどるよりもファイルを探し出す負荷が軽くなります。IDをそのままURLとして扱うことで、直接HTTPの宛先として紐付けられることになります。

このような背景によりオブジェクトストレージの通信プロトコルは、少ないオーバヘッドでファイルの読み書きをするHTTP上のREST方式が一般的です。クラウドのような大量データをインターネット等の広帯域網を経由し複数データセンター間でやり取りする環境での利用にも適しています。

(3)属性情報(メタデータ)を付与しデータ管理

オブジェクトストレージには、オブジェクト毎にカスタマイズした属性情報(メタデータ)を付与できます。この属性情報により、オブジェクトに期限を設定し消去したり、利用頻度に応じて高価・高性能のストレージと低コストのストレージを使い分けて格納するなど、データ管理を効率的に行うことができます。

たとえば、CloudianのAWS Tiering機能を使うと、機能を設定したバケット内で一定期間経過したオブジェクトを自動的にAmazonのS3や低コストのアーカイブストレージであるGlacierに移動(自動階層化)することができ、この際は属性情報に保存先がCloudianかAmazonかといった内容を付与することができます。

CloudianからAWS S3やGlacierに自動階層化

また、オブジェクトにアクセスできる利用者を制限する属性情報を付与することで、データの安全性を高めることもできます。

(4)高い拡張性、柔軟性、信頼性

SANやNASといった一般的な専用ストレージ装置は、データで容量一杯になると、より高性能・大容量の装置に置換(スケールアップ)し、データを入れ替えるという作業が必要になります。オブジェクトストレージは、データの格納場所に制約がないことから、新たなハードウェアを追加しデータを分散配置することが簡単であり、システム全体の容量を柔軟に拡張(スケールアウト)できます。

その際、あるオブジェクトを格納しているハードウェアに障害があっても、システム全体としては、そのオブジェクトが消失しないよう、複数のハードウェア装置に複製(Replication)したり、複数のハードウェア装置に分割して消失訂正符号も格納(Erasure Coding)することで信頼性を高めています。

(5)経済性

オブジェクトストレージは、大きく分けてハードウェアアプライアンス製品とソフトウェア製品の2種類があります。このうち、Cloudianのようなソフトウェア製品は、汎用的なサーバーをハードウェアに使います。あるハードウェアベンダーにロックインされることなく、また専用ストレージ装置よりも低コストで調達でき、経済性の高いストレージ基盤を構築することができます。