"Apache Hadoop"向けの分散ファイルシステム。
"HDFSクラスタ"(HDFSを構成するコンピュータによるクラスタ)では、ファイルを一定サイズのブロック(デフォルトは64MB)に分割して複数のコンピュータ上のディスクに格納することで、大量のデータを処理する際のスループットを向上させる。
"HDFSクラスタ"は、ファイルシステム全体を統括する"ネームノード"(NameNode)とデータブロックが格納される"データノード"(DataNode)の二つの構成要素から成り、各データブロックは"データノード"に多重化して記録されることで、信頼性を確保している。