Apache Nutch

Apache Nutch

Apache Nutch adalah projek perisian crawler web sumber terbuka yang boleh diperluas dan berskala.Nutch dikodkan sepenuhnya dalam bahasa pengaturcaraan Java, tetapi data ditulis dalam format bebas bahasa.Ia mempunyai seni bina yang sangat modular, yang membolehkan pemaju membuat pemalam untuk parsing-jenis media, pengambilan semula data, pertanyaan dan clustering.Penarik ("robot" atau "crawler web") telah ditulis dari awal untuk projek ini.

Kategori

Alternatif untuk Apache Nutch untuk Web dengan lesen percuma