ArchiveBox

ArchiveBox

🗃 Arkib web yang menjadi tuan rumah sumber terbuka.Membawa sejarah pelayar / penanda buku / Pocket / Pinboard / dll, menjimatkan HTML, JS, PDF, media, dan banyak lagi.
  • Percuma
Oleh kerana laman web moden rumit dan sering bergantung pada kandungan dinamik, Arkib archives laman web dalam beberapa format yang berbeza melangkaui perkhidmatan pengarkiban awam seperti Archive.org dan Archive.is mampu menyimpan.ArchiveBox mengimport senarai URL dari stdin, url jauh atau fail, kemudian menambah halaman ke folder arkib setempat menggunakan wget untuk membuat klon html yang boleh disemak, youtube-dl untuk mengeluarkan media, dan contoh penuh Chrome tanpa kepala untuk PDF,Tangkapan skrin dan DOM, dan banyak lagi ... Menggunakan pelbagai kaedah dan penyemak imbas yang dominan pasaran untuk melaksanakan JS memastikan kita dapat menyimpan walaupun laman web yang paling rumit, rumit dalam sekurang-kurangnya beberapa format data berkualiti tinggi, jangka panjang.### Boleh mengimport pautan daripada: - Pocket, Pinboard, Instapaper - RSS, XML, JSON, atau senarai teks biasa - Sejarah penyemak imbas atau penanda halaman (Chrome, Firefox, Safari, IE, Opera dan banyak lagi) - Shaarli, Delicious, RedditSiaran Tersimpan, Wallabag, Unmark.it, dan mana-mana teks lain dengan pautan di dalamnya!### Boleh menyimpan perkara-perkara ini untuk setiap tapak: - favicon `favicon.ico` dari laman web -` example.com / page-name.html` klon wget tapak, dengan. Html yang ditambahkan jika tidak ada - `output.pdf 'Printed PDF site using chrome headless - `screenshot.png` 1440x900 screenshot of site using chrome headless -` output.html` DOM Dump of HTML after rendering using chrome headless - `archive.org.txt` Link kepadatapak yang disimpan di arkib.org - `warc /` untuk fail wark html + gzip.gz - `media /` ada mp4, mp3, sarikata, dan metadata yang dijumpai menggunakan youtube-dl - `git /` clone sebarang repository untuk pautan github, bitbucket, atau gitlab - `index.html` &` index.json`Fail-fail indeks HTML dan JSON yang mengandungi metadata dan butiran Pengarsipan adalah aditif, jadi anda boleh menjadualkan `./ archive` untuk menjalankan secara teratur dan tarik pautan baru ke dalam indeks.Semua kandungan yang disimpan adalah statik dan diindeks dengan fail JSON, jadi ia hidup selamanya & mudah dipasangkan, ia tidak memerlukan backend yang selalu berjalan.
archivebox

Kategori

Alternatif untuk ArchiveBox untuk Windows

Wget

Wget

GNU Wget adalah pakej perisian percuma untuk mengambil fail menggunakan HTTP (S) dan FTP, protokol internet yang paling banyak digunakan.
HTTrack

HTTrack

Perkhidmatan menyalin laman web yang memuat turun seluruh laman web dan membina secara rekursif secara setempat.
wallabag

wallabag

wallabag adalah aplikasi sumberdaya diri opensource untuk menyimpan halaman web. ## Pembacaan yang selesa
Stash.ai

Stash.ai

Stash adalah apl penanda pintar peranti silang yang disokong oleh kecerdasan buatan.Simpan artikel, video dan apa sahaja.Mereka secara automatik dikategorikan untuk anda.
PageArchiver

PageArchiver

PageArchiver (sebelum ini dipanggil "Scrapbook for SingleFile") ialah sambungan Chrome yang membantu anda mengarkib halaman web untuk bacaan luar. Ciri-ciri utama adalah:
Fossilo

Fossilo

Fossilo.com meneruskan arkib laman web lengkap sebagai pdf dan pelbagai format lain agar mudah dibuka dan dilihat tanpa sebarang kebergantungan pada masa akan datang.Anda boleh menavigasi arkib dalam plattform atau memuat turunnya sebagai pakej bebas.
Web Dumper

Web Dumper

Muat turun seluruh laman web di Internet, dan simpannya pada cakera keras anda ...