Hadoop, HDFS olarak bilinen dağıtılmış bir dosya sistemi ve MapReduce olarak bilinen büyük veri setlerini işlemek için yazılım kullanır. Son derece büyük dosyalar, her biri 64 veya 128 MB olmak üzere parçalara bölünür. Yazılım çoğunlukla Java ile yazılmış olup, C ile yazılmış daha düşük bir seviye kodu vardır.
Apache sunucusu, Büyük veri, Servis, Yazılım terimleri