12
ArchiveBox
🗃 Arkib web yang menjadi tuan rumah sumber terbuka.Membawa sejarah pelayar / penanda buku / Pocket / Pinboard / dll, menjimatkan HTML, JS, PDF, media, dan banyak lagi.
- Percuma
Oleh kerana laman web moden rumit dan sering bergantung pada kandungan dinamik, Arkib archives laman web dalam beberapa format yang berbeza melangkaui perkhidmatan pengarkiban awam seperti Archive.org dan Archive.is mampu menyimpan.ArchiveBox mengimport senarai URL dari stdin, url jauh atau fail, kemudian menambah halaman ke folder arkib setempat menggunakan wget untuk membuat klon html yang boleh disemak, youtube-dl untuk mengeluarkan media, dan contoh penuh Chrome tanpa kepala untuk PDF,Tangkapan skrin dan DOM, dan banyak lagi ... Menggunakan pelbagai kaedah dan penyemak imbas yang dominan pasaran untuk melaksanakan JS memastikan kita dapat menyimpan walaupun laman web yang paling rumit, rumit dalam sekurang-kurangnya beberapa format data berkualiti tinggi, jangka panjang.### Boleh mengimport pautan daripada: - Pocket, Pinboard, Instapaper - RSS, XML, JSON, atau senarai teks biasa - Sejarah penyemak imbas atau penanda halaman (Chrome, Firefox, Safari, IE, Opera dan banyak lagi) - Shaarli, Delicious, RedditSiaran Tersimpan, Wallabag, Unmark.it, dan mana-mana teks lain dengan pautan di dalamnya!### Boleh menyimpan perkara-perkara ini untuk setiap tapak: - favicon `favicon.ico` dari laman web -` example.com / page-name.html` klon wget tapak, dengan. Html yang ditambahkan jika tidak ada - `output.pdf 'Printed PDF site using chrome headless - `screenshot.png` 1440x900 screenshot of site using chrome headless -` output.html` DOM Dump of HTML after rendering using chrome headless - `archive.org.txt` Link kepadatapak yang disimpan di arkib.org - `warc /` untuk fail wark html + gzip.gz - `media /` ada mp4, mp3, sarikata, dan metadata yang dijumpai menggunakan youtube-dl - `git /` clone sebarang repository untuk pautan github, bitbucket, atau gitlab - `index.html` &` index.json`Fail-fail indeks HTML dan JSON yang mengandungi metadata dan butiran Pengarsipan adalah aditif, jadi anda boleh menjadualkan `./ archive` untuk menjalankan secara teratur dan tarik pautan baru ke dalam indeks.Semua kandungan yang disimpan adalah statik dan diindeks dengan fail JSON, jadi ia hidup selamanya & mudah dipasangkan, ia tidak memerlukan backend yang selalu berjalan.
Kategori
Alternatif untuk ArchiveBox untuk semua platform dengan sebarang lesen
2
WebArchives
Penonton arkib web menawarkan keupayaan untuk melayari jutaan artikel luar talian dari projek komuniti besar seperti Wikipedia atau Wikisource. Ciri-ciri:
1
Web Dumper
Muat turun seluruh laman web di Internet, dan simpannya pada cakera keras anda ...