Apache Spark

Apache Spark

Apache Spark ™ adalah enjin yang cepat dan umum untuk pemprosesan data berskala besar. ProgramSeedRun sehingga 100x lebih cepat daripada Hadoop MapReduce dalam memori, atau 10x lebih cepat pada cakera.
Apache Spark ™ adalah enjin yang cepat dan umum untuk pemprosesan data berskala besar.Program Run Speed ​​hingga 100x lebih cepat daripada Hadoop MapReduce dalam ingatan, atau 10x lebih cepat pada cakera.Spark mempunyai enjin pelaksanaan DAG yang maju yang menyokong aliran data kitaran dan pengkomputeran dalam memori.
apache-spark

Alternatif untuk Apache Spark untuk Mac

Apache Hadoop

Apache Hadoop

Apache Hadoop adalah kerangka kerja perisian sumber terbuka yang menyokong aplikasi diedarkan intensif data yang dilesenkan di bawah lesen Apache v2.
Disco MapReduce

Disco MapReduce

Disco adalah rangka kerja yang ringan dan terbuka untuk pengkomputeran yang diedarkan berdasarkan paradigma MapReduce dan ditulis dalam Python.