
9
Apache Spark ™ adalah enjin yang cepat dan umum untuk pemprosesan data berskala besar.Program Run Speed hingga 100x lebih cepat daripada Hadoop MapReduce dalam ingatan, atau 10x lebih cepat pada cakera.Spark mempunyai enjin pelaksanaan DAG yang maju yang menyokong aliran data kitaran dan pengkomputeran dalam memori.
WebSite:
http://spark.apache.orgKategori
Alternatif untuk Apache Spark untuk Linux

18
Apache Hadoop
Apache Hadoop adalah kerangka kerja perisian sumber terbuka yang menyokong aplikasi diedarkan intensif data yang dilesenkan di bawah lesen Apache v2.

1
Disco MapReduce
Disco adalah rangka kerja yang ringan dan terbuka untuk pengkomputeran yang diedarkan berdasarkan paradigma MapReduce dan ditulis dalam Python.