Digital MarketingContent CreationSEO

Ketahui 4 Penyebab Duplicate Content dan Cara Mengatasinya

Andy Chrisman Sianturi

Ketahui 4 Penyebab Duplicate Content dan Cara Mengatasinya

Duplicate content sering kali menjadi tantangan besar bagi pemilik situs web yang ingin meningkatkan peringkat di mesin pencari.

Tanpa disadari, konten yang tampak serupa di berbagai halaman bisa berdampak buruk pada SEO dan membuat visibilitas situs webmu menurun. Apakah kamu pernah mengalami masalah ini?

Jangan khawatir, di dalam artikel ini, kita akan mengupas tuntas beberapa penyebab utama duplicate content dan memberikan solusi praktis untuk mengatasinya.

Apa Itu Duplicate Content?

Apa Itu Duplicate Content?
Apa Itu Duplicate Content?

Duplicate content mengacu pada materi yang muncul di lebih dari satu lokasi online, baik di situs web yang sama atau situs berbeda. Meskipun mungkin tidak persis identik, tapi konten yang cukup mirip di dalam hal kata-kata, susunan, dan penyajiannya bisa tetap dikategorikan sebagai duplikat.

Duplicate content dapat muncul di berbagai halaman dalam situs web yang sama atau di situs web yang berbeda. Sebuah konten dianggap duplikat jika:

  1. Jika dua halaman web memiliki teks yang sangat mirip atau mengikuti pola yang sama di dalam penyusunan paragraf, daftar, atau format keseluruhan, konten tersebut dianggap duplikat. Ini terjadi meskipun mungkin ada sedikit perbedaan di sana-sini.
  2. Konten dianggap duplikat jika tidak menyajikan informasi yang berbeda atau segar. Jika isi halaman web hanya mengulang hal-hal yang sudah dibahas di halaman lain tanpa memberikan wawasan tambahan, maka konten itu tidak orisinal.
  3. Salah satu faktor terpenting adalah apakah konten memberikan sesuatu yang baru atau bermanfaat bagi pembaca. Jika sebuah halaman hanya mengulang informasi dari halaman lain tanpa menambah pemahaman atau sudut pandang baru, maka konten tersebut dianggap tidak memberikan nilai lebih dan bisa dianggap duplikat.

Baca juga: 2 Cara Mudah Memanfaatkan Google Autocomplete untuk Riset

Dampak Buruk Duplicate Content Pada SEO

Dampak Buruk Duplicate Content Pada SEO
Dampak Buruk Duplicate Content Pada SEO

Duplicate content tentu dapat merugikan SEO karena mesin pencari mungkin kebingungan dalam menentukan halaman mana yang seharusnya ditampilkan kepada pengguna. Ini dapat menyebabkan halaman-halaman tersebut memiliki peringkat lebih rendah di hasil pencarian.

Meskipun Google menyatakan bahwa tidak ada penalti langsung untuk konten duplikat. Tapi, duplicate content tetap bisa berdampak negatif pada kinerja SEOmu karena beberapa alasan berikut ini.

Mengakibatkan Penurunan Peringkat

Google memiliki tujuan untuk menampilkan halaman dengan informasi yang orisinal dan bermanfaat bagi pengguna, bukan halaman yang hanya menyalin konten dari tempat lain, termasuk dari situs webmu sendiri.

Untuk itulah Google memiliki algoritma yang dirancang agar konten asli mendapat prioritas di dalam hasil pencarian. Jika situs webmu memiliki beberapa halaman dengan isi yang mirip, maka Google akan mencoba menentukan halaman mana yang paling orisinal.

Tapi, jika Google kesulitan mengidentifikasi halaman yang asli, hal itu bisa menurunkan peringkat halaman-halamanmu. Bahkan, ada kemungkinan halaman tersebut tidak muncul di hasil pencarian sama sekali.

Selain itu, jika kontenmu tetap masuk dalam hasil pencarian, Google mungkin menampilkan versi yang berbeda dari yang sebenarnya kamu inginkan untuk muncul di hasil mesin pencari (SERP).

Distribusi Otoritas Situs yang Buruk

Backlink adalah tautan dari situs web lain yang mengarah ke situs webmu, dan setiap backlink berfungsi seperti tanda kepercayaan. Ini memberi tahu Google bahwa kontenmu dianggap bermanfaat dan dapat dipercaya oleh situs lain.

Tapi, jika kamu memiliki lebih dari satu versi konten yang sama, hal ini bisa mengurangi kekuatan backlink. Misalkan kamu memiliki 2 halaman dengan konten yang identik, tetapi URLnya berbeda, seperti ini:

  1. https://www.techwebsite.com/reviews/smartphone-review
  2. https://www.techwebsite.com/smartphone/reviews/best-smartphone

Jika totalnya ada 100 backlink, 60 di antaranya mungkin mengarah ke halaman pertama, sementara 40 backlink lainnya tertaut ke halaman kedua.

Alih-alih satu halaman yang memiliki 100 backlink penuh, backlink tersebut terbagi di antara 2 halaman. Berarti masing-masing halaman hanya mendapatkan sebagian dari kekuatan backlink, sehingga mengurangi otoritas dan dapat membuat keduanya peringkat lebih rendah di mesin pencari.

Ini terjadi karena Google tidak dapat mengidentifikasi satu halaman yang paling relevan untuk didorong naik ke dalam hasil pencarian.

Sebelum khawatir, penting untuk diketahui bahwa duplicate content tidak selalu menjadi masalah besar karena Google memiliki cara khusus untuk menanganinya.

Ketika Google menemukan duplicate content, mereka akan mengelompokkan URL yang mirip ke dalam satu grup. Setelah itu, mereka akan memilih satu URL yang dianggap paling baik untuk mewakili grup tersebut dalam hasil pencarian.

Semua kualitas penting dari URL di dalam grup, seperti jumlah backlink atau popularitas, akan digabungkan ke URL yang dipilih tersebut. Proses ini disebut dengan “canonicalization.”

Merusak Crawling Situs Web

Mesin pencari seperti Google perlu menjelajahi dan mengindeks konten di situs webmu agar bisa muncul di hasil pencarian. Jika ada halaman duplikat, masalah ini bisa memboroskan anggaran crawling situsmu.

Ini terjadi karena crawler mesin pencari mungkin memeriksa beberapa versi konten yang sama, sehingga mengurangi waktu untuk menjelajahi halaman lain yang mungkin lebih penting.

Dengan memperlambat proses indexing halaman baru dan memperlambat re-indexing halaman yang sudah diperbarui. Akibatnya, halaman baru mungkin tidak segera muncul di hasil pencarian, dan perubahan yang kamu buat di halaman lama mungkin tidak segera terlihat oleh mesin pencari.

Penyebab Umum Masalah Duplicate Content

Penyebab Umum Masalah Duplicate Content
Penyebab Umum Masalah Duplicate Content

Jika duplicate content di situs webmu terjadi secara tidak sengaja dan bukan karena upaya manipulasi hasil pencarian atau tindakan spam, kamu tidak akan mendapat penalti. Tapi, jika konten tersebut sengaja dibuat untuk menipu mesin pencari, maka kamu bisa dikenai sanksi.

Ada berbagai alasan mengapa konten bisa terduplikasi tanpa sengaja, terutama yang disebabkan oleh masalah teknis di dalam struktur situs web, seperti variasi URL atau konten yang disalin. Berikut adalah beberapa penyebab yang paling sering terjadi.

Pengelolaan HTTP dan HTTPS dengan URL yang Keliru

Pengguna sering kali bisa mengakses situs web melalui URL dengan “www” di depannya atau tanpa “www”. Jika situs webmu dapat diakses dengan kedua cara ini dan kamu tidak menangani variasi ini dengan baik, itu dapat menyebabkan masalah duplicate content.

Sebagian besar situs web dapat diakses melalui salah satu dari 4 variasi URL ini:

  1. https://www.contoh.com (HTTPS, dengan www)
  2. https://contoh.com (HTTPS, tanpa www)
  3. http://www.contoh.com (HTTP, dengan www)
  4. http://contoh.com (HTTP, tanpa www)

Jika kamu menggunakan HTTPS, berarti kamu hanya akan menggunakan dua yang pertama. Kamu bisa memilih untuk menggunakan versi dengan www atau tanpa www.

Tapi, jika servermu tidak dikonfigurasi dengan benar, situs webmu bisa diakses melalui dua atau lebih variasi ini. Situasi ini tidak ideal dan dapat menyebabkan masalah duplicate content.

Penggunaan Garis Miring dalam URL

Google menganggap URL dengan dan tanpa garis miring sebagai dua alamat yang berbeda. Ini berarti kedua URL berikut dianggap unik oleh Google:

  1. contoh.com/halaman/
  2. contoh.com/halaman

Jika kontenmu dapat diakses melalui kedua URL ini, itu bisa menyebabkan masalah duplicate content. Untuk mengetahui apakah ini menjadi masalah, coba buka halaman dengan dan tanpa garis miring di akhir. Idealnya, hanya satu versi yang seharusnya bisa diakses. Versi yang lain seharusnya dialihkan ke versi yang benar.

Misalnya, jika kamu mencoba membuka URL tanpa garis miring di akhir, maka kamu seharusnya dialihkan ke URL yang memiliki garis miring di akhir. Google mengatakan bahwa ini adalah cara yang ideal. Jika hanya satu versi yang dapat diakses, itu adalah pilihan yang bagus karena membantu mengurangi masalah duplicate content.

Menggunakan Faceted Navigation

Faceted navigation adalah sistem yang memungkinkan pengguna untuk memfilter dan mengurutkan produk di halaman, ini lebih sering digunakan di situs web e-commerce.

Sistem ini menambahkan parameter di akhir URL, dan karena banyaknya kombinasi filter yang tersedia, maka navigasi ini dapat menghasilkan banyak duplicate content atau sangat mirip.

Contoh URL yang berbeda tetapi mengarah ke konten yang sama:

  1. URL 1: www.shoestore.com/sepatu/olahraga.html?warna=merah
  2. URL 2: www.shoestore.com/sepatu/olahraga.html?ukuran=42&warna=merah
  3. URL 3: www.shoestore.com/sepatu/olahraga.html?ukuran=42&warna=biru

Ketiga URL ini memiliki parameter yang berbeda, tetapi mereka mungkin menampilkan produk yang sangat mirip atau bahkan identik. Dalam hal ini, meskipun URL-nya berbeda, tapi konten yang ditampilkan hampir tidak ada perbedaan.

Selain itu, urutan parameter dalam URL juga bisa bervariasi tanpa mengubah hasilnya:

  1. URL 4: www.shoestore.com/sepatu/olahraga.html?warna=biru&ukuran=4
  2. URL 5: www.shoestore.com/sepatu/olahraga.html?ukuran=42&warna=biru

Kedua URL ini mengarah ke konten yang sama, tetapi karena urutan parameter yang berbeda, ini menciptakan lebih banyak variasi URL yang dianggap sebagai duplicate content oleh mesin pencari.

Situasi ini dapat membuat sulit bagi mesin pencari untuk menentukan halaman mana yang harus diprioritaskan dalam hasil pencarian, sehingga dapat mempengaruhi peringkat SEO situs webmu.

Menggunakan URL Terpisah untuk Versi Desktop dan Seluler

Salah satu cara untuk membuat situs webmu lebih mobile friendly adalah dengan menggunakan URL yang berbeda untuk versi desktop dan versi selulernya.

Misalnya, kamu dapat menggunakan “contoh.id” untuk pengguna yang mengakses melalui komputer, sementara pengguna yang mengakses melalui ponsel dapat diarahkan ke “m.contoh.id.”

Pendekatan ini memungkinkan kamu untuk menyesuaikan konten dan desain agar lebih sesuai dengan perangkat seluler, sehingga memberikan pengalaman yang lebih baik bagi pengguna.

Tapi, jika tidak diatur dengan benar, penggunaan URL yang terpisah untuk versi seluler dan desktop bisa menyebabkan masalah duplicate content.

Ini terjadi ketika mesin pencari menemukan konten yang sama di kedua versi URL tersebut, sehingga menyulitkan mereka untuk menentukan mana yang harus diutamakan dalam hasil pencarian.

Cara Mengecek dan Mengatasi Masalah Duplicate Content

Cara Mengecek dan Mengatasi Masalah Duplicate Content
Cara Mengecek dan Mengatasi Masalah Duplicate Content

Salah satu cara untuk menemukan masalah duplicate content adalah dengan mengecek indexing. Google Search Console (GSC) adalah alat gratis yang membantu kamu memeriksa apakah semua halaman di situs webmu telah terindeks dan mana yang belum.

Alat ini juga memberikan informasi tentang alasan halaman tertentu tidak terindeks, salah satunya adalah karena adanya duplicate content.

Untuk memulai, kamu perlu menyiapkan GSC yang terhubung dengan situs webmu. Setelah itu, ikuti langkah-langkah ini:

  1. Klik tab “Pages” di bawah bagian “Indexing” di menu sebelah kiri. Di sana, kamu akan melihat grafik yang menunjukkan jumlah halaman yang sudah terindeks dan yang belum terindeks.
  2. Scroll ke bawah untuk menemukan alasan di balik halaman-halaman yang tidak terindeks. Untuk melihat daftar halaman duplikat, klik pada kesalahan yang bertuliskan “Duplicate, Google chose different canonical than user” jika kamu menemui masalah ini.
  3. Dengan meng-klik kesalahan tersebut, kamu akan membuka laporan yang menunjukkan grafik jumlah halaman yang terpengaruh dari waktu ke waktu, serta daftar halaman yang terduplikasi.
  4. Setelah kamu memperbaiki masalah ini dengan salah satu metode yang akan dijelaskan di bawah, jangan lupa untuk mengklik “Validate Fix” untuk meminta Google memeriksa kembali situs webmu.

Sekarang, mari kita lanjutkan cara-cara untuk menghindari masalah yang disebabkan oleh duplicate content atau cara memperbaiki masalah yang sudah ada. Berikut ini 2 metode yang bisa kamu terapkan.

Terapkan Canonical Tag

Canonical tag atau yang dikenal dengan tag rel=”canonical,” adalah sepotong kode HTML yang digunakan untuk menunjukkan URL yang seharusnya dianggap sebagai versi utama dari konten yang mungkin ada dalam bentuk duplikat atau sangat mirip.

Tag ini memberikan informasi kepada mesin pencari tentang halaman mana yang kamu inginkan untuk diindeks dan ditampilkan dalam hasil pencarian.

Kamu bisa menemukan tag ini di bagian <head> dari kode HTML di situs webnu. Jika canonical tag merujuk pada halaman itu sendiri, ini bisa membantu melindungi kontenmu dari scraper, karena tag ini menunjukkan kepada mesin pencari bahwa halaman yang mereka lihat adalah sumber yang sah dan terpercaya.

Jika scraper menyalin kontenmu dan tidak menyertakan tag ini dengan benar, maka mesin pencari akan lebih cenderung mengenali halamanmu sebagai yang asli.

Menambahkan canonical tag akan berbeda tergantung pada CMS yang kamu gunakan, seperti WordPress. Di WordPress, cara termudah untuk menambahkan tag ini adalah dengan menggunakan plugin Yoast SEO.

Ini langkah-langkahnya:

  1. Masuk ke akun WordPress.
  2. Tambahkan plugin Yoast SEO dengan meng-klik “Plugin” > “Add New” di menu sebelah kiri.
  3. Ketik “Yoast SEO” di bilah pencarian, cari plugin tersebut, lalu klik “Install Now.”
  4. Setelah plugin terpasang dan dikonfigurasi, buka “Pages” di bilah sisi dan pilih salah satu halaman yang memiliki duplicate content.
  5. Klik logo Yoast SEO di sudut kanan atas layar untuk membuka sidebar plugin.
  6. Gulir ke bawah hingga kamu menemukan bagian “Advanced.” Klik untuk membukanya dan masukkan URL kanonik di kolom yang tersedia di bawah “Canonical URL.”

Jika halaman tersebut merupakan duplikat, masukkan URL halaman yang kamu ingin Google indeks. Jika kamu berada di halaman yang ingin diindeks, maka masukkan URL halaman tersebut untuk merujuk ke dirinya sendiri dengan canonical tag. Setelah kamu selesai, lakukan audit untuk memastikan semua sudah benar.

Baca juga: 7 Tips Memanfaatkan User Generated Content untuk Dorong Brand Awareness

Gunakan 301 Redirect

301 redirect adalah metode yang digunakan untuk mengalihkan pengguna dan mesin pencari dari satu URL ke URL lainnya secara permanen. Ini sangat berguna untuk menangani duplicate content yang tidak perlu kamu simpan, seperti saat kamu beralih dari HTTP ke HTTPS atau saat memindahkan halaman ke alamat URL baru.

Misalnya, jika kamu memperbarui halaman produk dan mengubah URL dari produk-lama menjadi produk-baru, penting untuk menerapkan 301 redirect dari URL lama ke URL baru.

Dengan cara ini, ketika pelanggan atau mesin pencari mengunjungi www.tokosaya.com/produk-lama, mereka akan secara otomatis diarahkan ke www.tokosaya.com/produk-baru.

Redirect ini juga membantu mempertahankan peringkat SEO halaman lama dan memastikan bahwa semua tautan yang mengarah ke URL lama tetap berfungsi dengan baik. Ini juga memberikan pengalaman pengguna yang lebih baik, karena mereka tidak akan menemukan halaman error atau 404 Not Found saat mengakses URL lama.

Dengan menerapkan solusi seperti canonical tag dan 301 redirect, kamu dapat menghindari masalah yang dapat merugikan situs webmu. Tapi, jika kamu mencari cara efektif untuk mengoptimalkan situs webmu, pertimbangkan Optimaise sebagai mitra terpercaya.

Kami menyediakan jasa SEO yang komprehensif, penulisan artikel SEO friendly yang menarik, serta jasa SEO di Bali yang dapat membantu kamu mencapai tujuan bisnismu. Bergabunglah dengan Optimaise dan maksimalkan potensi onlinemu!

[addtoany]

Baca Juga

Optimaise