• Masim “Vavai” Sugianto

    Founder PT. Excellent Infotama Kreasindo– perusahaan email services provider (ESP) dan menjadi konsultan pada berbagai instansi pemerintah, korporasi besar, lembaga perbankan dan institusi pendidikan di Indonesia.

    Lebih detail tentang Vavai.




  • Publishing

  • Recent Posts

    • Suasana Training Virtualisasi Server Berbasis VMware vSphere 6.7
    • Excellent Insight Day #27 : Berpikir Positif
    • Intel NUC Hades Canyon untuk Simulasi VMware vSphere, Kerja dan Main Games
    • Ebook Panduan Dasar VMware vSphere Edisi 2019
    • Kolam Ikan Gurame, Nila dan Patin
  • Recent Comments

    • Suasana Training Virtualisasi Server Berbasis VMware vSphere 6.7 – Masim Vavai Sugianto on Ebook Panduan Dasar VMware vSphere Edisi 2019
    • Kolam Ikan Gurame, Nila dan Patin – Masim Vavai Sugianto on Membuat Kolam Tanah untuk Ikan Konsumsi
    • Termakan Merk dan Nama Besar? – Masim Vavai Sugianto on Training Untangle Next Generation Firewall
    • Thoriq on 5 Alasan Mengapa Staff IT Kurang Dihargai Staff Lain/Atasan Sendiri
    • Masim Vavai Sugianto on Bekerja Di Luar Kantor
  • Archives

    • February 2019
    • January 2019
    • November 2018
    • October 2018
    • August 2018
    • May 2018
    • April 2018
    • January 2018
    • December 2017
    • July 2017
    • December 2016
    • November 2016
    • April 2016
    • March 2016
    • November 2015
    • July 2015
    • April 2015
    • November 2014
    • October 2014
    • February 2014
    • January 2014
    • December 2013
    • November 2013
    • October 2013
    • September 2013
    • August 2013
    • June 2013
    • May 2013
    • March 2013
    • February 2013
    • January 2013
    • December 2012
    • November 2012
    • October 2012
    • September 2012
    • August 2012
    • July 2012
    • June 2012
    • May 2012
    • April 2012
    • March 2012
    • February 2012
    • January 2012
    • December 2011
    • November 2011
    • October 2011
    • September 2011
    • August 2011
    • July 2011
    • June 2011
    • May 2011
    • April 2011
    • March 2011
    • February 2011
    • January 2011
    • December 2010
    • November 2010
    • October 2010
    • September 2010
    • August 2010
    • July 2010
    • June 2010
    • May 2010
    • April 2010
    • March 2010
    • February 2010
    • January 2010
    • October 2008
    • September 2008
    • August 2008
    • July 2008
    • June 2008
    • May 2008
    • April 2008
    • March 2008
    • February 2008
    • January 2008
    • December 2007
    • November 2007
    • October 2007
    • September 2007
    • August 2007
    • July 2007
    • June 2007
    • May 2007
    • April 2007
    • March 2007
  • Home
  • Bisnis & Marketing
  • Computer & IT Related
  • Lifestyle
  • Publishing
  • Free Stuff
  • About
  • Kontak

Tips : Ekstrak URL dari File HTML

February 12, 2011

Beberapa waktu yang lalu Zimbra versi 7 dirilis untuk public dan saya ingin mendownloadnya ke server IIX agar bisa dengan cepat dan mudah didownload oleh rekan-rekan yang memerlukan. Sayangnya, Zimbra tidak menyediakan fasilitas rsync atau sejenisnya sehingga saya harus mendownload binarynya satu per satu dari alamat http://www.zimbra.com/downloads/os-downloads.html.

Melakukan copy-paste link satu per satu tentu bukan pilihan yang menarik karena ada puluhan link yang ada disana, padahal yang saya perlukan hanya akses ke link download Zimbra 7 saja.

Setelah browsing beberapa saat, saya menemukan script yang cukup brilian, hanya cukup 1 baris perintah untuk mengekstrak informasi link sesuai dengan parameter yang diperlukan. Berikut adalah caranya :

  1. Simpan halaman yang ingin diekstrak, dalam hal ini halaman http://www.zimbra.com/downloads/os-downloads.html
  2. Ketikkan perintah berikut ini :
    sed -rn 's|.*(http://files2[^"]*).*|\1|p' zimbra-download.html > daftar-url.sh

    sed -rn 's|.*(http://files2[^"]*).*|\1|p' zimbra-download.html > daftar-url.sh

Perintah diatas akan membaca file zimbra-download.html dan mengekstrak semua link yang berawalan “http://files2” dan memasukkan linknya ke file teks daftar-url.sh. File daftar-url.txt ini bisa saya edit dan menambahkan perintah wget -c (find & replace http menjadi wget -c http). Sebenarnya bisa juga memodifikasi script agar hasil sed sudah menyertakan perintah wget -c. File sh yang dihasilkan bisa digunakan untuk melakukan download semua file binary Zimbra.

Sederhana sekali namun hasilnya mantabs 😉

Share this:

  • Facebook
  • Twitter
  • Print
  • Email
Bashplanet-terasi-aggregatorSed
Share

Tips, Tricks & Tutorial

Masim Vavai Sugianto
Masim Vavai Sugianto, Tinggal di Bekasi, Bekerja sebagai wirausahawan/Konsultan IT. Penganjur penggunaan sistem Linux dan aplikasi Open Source. Hobby Membaca, Hiking dan Avonturir. Mengembangkan PT. Excellent Infotama Kreasindo sebagai lembaga training dan IT consulting.

You might also like

Usia 40
January 28, 2019
Upaya Mencapai FIRE dan Rambu-Rambu Investasi
January 20, 2019
Rutinitas Menulis Blog & Pola Proteksi Keberlangsungan Bisnis
January 15, 2019

3 Comments


Tweets that mention Tips : Ekstrak URL dari File HTML | Migrasi Windows Linux -- Topsy.com
February 12, 2011 at 2:52 pm

[…] This post was mentioned on Twitter by Edi Indira, Planet Terasi and Kukuh Syafaat, vavai. vavai said: http://vavai.com : Tips : Ekstrak URL dari File HTML http://goo.gl/fb/fyR1n […]



iang
February 12, 2011 at 3:13 pm

kalau punya file berisi daftar url, pake wget -i daftar.txt biar wget ngedownload semua url yg tertulis di dalamnya. ngga perlu satu2 ditambahin wget dan dijadikan script segala 🙂



Masim Vavai Sugianto
February 12, 2011 at 3:44 pm

@Iang, thanks buat tambahannya, sarannya mempercepat ke tujuan.



Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

CAPTCHA
Refresh

*

This site uses Akismet to reduce spam. Learn how your comment data is processed.

  • Artikel



  • Blogroll

    • DNS Propagation Checker
    • Instagram Photo/Video Downloader
    • PT. Excellent Infotama Kreasindo
  • Publishing

  • Recent Posts

    • Suasana Training Virtualisasi Server Berbasis VMware vSphere 6.7
    • Excellent Insight Day #27 : Berpikir Positif
    • Intel NUC Hades Canyon untuk Simulasi VMware vSphere, Kerja dan Main Games
    • Ebook Panduan Dasar VMware vSphere Edisi 2019
    • Kolam Ikan Gurame, Nila dan Patin
    • Persiapan Training Virtualisasi Server Berbasis VMware vSphere
    • Excellent Insight Day #26 : Mencari Jati Diri dan Menyiasati Rasa Minder
    • Kuliah Perdana
    • Excellent Insight Day #25 : Mau Sukses? Jangan Selalu Menuruti Setiap Keinginan
    • Termakan Merk dan Nama Besar?



    loading Cancel
    Post was not sent - check your email addresses!
    Email check failed, please try again
    Sorry, your blog cannot share posts by email.