Mengimpor Data dari Web ke Google Sheets dengan IMPORTHTML / IMPORTXML

Salah satu keunggulan Google Sheets adalah kemampuannya untuk terhubung langsung dengan internet. Dua fungsi yang sangat kuat untuk ini adalah IMPORTHTML dan IMPORTXML. Dengan fungsi-fungsi ini, Anda bisa secara otomatis menarik data terstruktur dari halaman web publik langsung ke dalam spreadsheet Anda.

Lupakan proses salin-tempel manual dari situs web yang melelahkan dan rentan kesalahan. Dengan fungsi impor data web, Anda bisa membuat laporan yang selalu ter-update dengan data terbaru dari sumbernya, seperti data kurs mata uang, harga saham, tabel statistik dari Wikipedia, atau jadwal pertandingan olahraga.

1. IMPORTHTML: Cara Termudah untuk Tabel dan Daftar

Fungsi IMPORTHTML dirancang khusus untuk mengimpor data dari elemen tabel (`

`) atau daftar (`
    ` atau `
      `) yang ada di sebuah halaman web. Ini adalah pilihan pertama yang harus Anda coba karena penggunaannya yang sangat sederhana.

      Sintaks:

      =IMPORTHTML(url; kueri; indeks)

      • url: Alamat URL halaman web yang ingin Anda ambil datanya (dalam tanda kutip).
      • kueri: Jenis elemen yang ingin Anda impor. Cukup ketik "table" atau "list" (dalam tanda kutip).
      • indeks: Nomor urutan tabel atau daftar di halaman tersebut, dimulai dari 1. Anda mungkin perlu mencoba beberapa angka untuk menemukan tabel yang benar.

      Contoh Penggunaan:

      Misalnya, kita ingin mengambil tabel data populasi negara dari halaman Wikipedia. Kita menemukan bahwa tabel yang kita inginkan adalah tabel pertama di halaman tersebut.

      =IMPORTHTML("https://en.wikipedia.org/wiki/List_of_countries_and_dependencies_by_population"; "table"; 1)

      Hanya dengan satu baris rumus ini, seluruh tabel dari halaman web tersebut akan langsung muncul di sheet Anda. Jika data di Wikipedia diperbarui, data di sheet Anda juga akan ikut ter-update secara berkala.

      2. IMPORTXML: Lebih Kuat dan Fleksibel dengan XPath

      Bagaimana jika data yang Anda inginkan tidak berada dalam format tabel atau daftar yang rapi? Mungkin itu hanya sebuah teks, harga produk, atau judul artikel. Di sinilah IMPORTXML berperan. Fungsi ini jauh lebih kuat karena menggunakan sintaks XPath untuk menargetkan elemen apa pun di dalam kode HTML atau XML sebuah halaman.

      Sintaks:

      =IMPORTXML(url; kueri_xpath)

      • url: Alamat URL halaman web.
      • kueri_xpath: Ekspresi XPath yang menunjuk ke elemen spesifik yang ingin Anda ambil datanya.

      Apa itu XPath?

      XPath (XML Path Language) adalah bahasa untuk menavigasi elemen dalam dokumen XML/HTML. Mempelajarinya secara mendalam memang rumit, tetapi untuk kebutuhan dasar, Anda bisa menggunakan beberapa trik sederhana:

      • Gunakan "Copy XPath" dari Browser: Cara termudah adalah dengan membuka halaman web di Google Chrome, klik kanan pada elemen data yang Anda inginkan, pilih Inspect, lalu di panel Elements yang muncul, klik kanan pada baris kode yang disorot dan pilih Copy > Copy XPath.

      Contoh Penggunaan:

      Misalnya, kita ingin mengambil judul (tag `

      `) dari sebuah halaman berita.

      1. Kita buka halaman berita tersebut.
      2. Klik kanan pada judul, pilih Inspect.
      3. Di panel Elements, kita menemukan kode seperti `

        Judul Beritanya Ada Di Sini

        `.
      4. Kita klik kanan pada baris kode tersebut, Copy > Copy XPath, dan mendapatkan sesuatu seperti `//*[@id="main-content"]/h1`.

      Kemudian kita masukkan ke dalam rumus di Google Sheets:

      =IMPORTXML("URL_halaman_berita"; "//*[@id='main-content']/h1")

      Fungsi ini akan mengembalikan teks judul tersebut ke dalam sel.

      Tips dan Batasan

      • Halaman Dinamis: Fungsi ini paling baik bekerja pada halaman web dengan HTML statis. Jika data dimuat menggunakan JavaScript setelah halaman dibuka, kemungkinan besar fungsi ini tidak akan berhasil.
      • Frekuensi Update: Google Sheets menyegarkan data dari fungsi-fungsi ini kira-kira setiap satu jam sekali. Jangan berharap update data real-time setiap detik.
      • Etika Web Scraping: Pastikan Anda hanya mengambil data dari situs web publik yang mengizinkannya dan jangan membebani server mereka dengan terlalu banyak permintaan.

      Dengan menguasai IMPORTHTML dan IMPORTXML, Anda membuka kemampuan baru untuk mengintegrasikan data dari seluruh web langsung ke dalam alur kerja analisis Anda di Google Sheets.

      Mau Berlangganan Contoh Surat Terbaru dari Kami?