Pirate 2.0 : algoritma anti pembajakan Google SE

Sebuah terobosan baru yang sangat besar dilakukan oleh Google pada mesin pencari-nya. Anda bisa mencobanya saat ini juga untuk melihat hasilnya. Masukkan kata kunci pada kolom Google SE, maka anda akan mendapatkan urutan blog / situs di halaman hasil mesin pencari (Google SERP) yang unik.

Kinerja yang dihasilkan oleh algoritma Pirate 2.0 ini akan menyajikan daftar blog / situs yang “pasti” berbeda dan unik di setiap Google SERP. Cerita yang saya peroleh adalah algoritma ini menggunakan dasar pelaporan yang masuk ke DMCA. Jadi, setiap blog / situs yang terdapat namanya dalam daftar DMCA sebagai pelaku tindak pelanggaran aturan / hukum internasional (khususnya tindak pelanggaran hak cipta) di dunia maya, tidak akan ditampilkan di SERP.

Namun, saya melihat dan mendapatkannya lebih dari sekedar hal itu.

Artikel dalam bentuk apapun yang memiliki konten / isi yang sama (apalagi persis), juga tidak ditampilkan. Apakah termasuk atau tidak dalam daftar DMCA, tidak peduli.

Saya belum mempelajari perilaku algoritma tersebut pada seluruh jenis artikel yang ada di internet. Hanya di bagian “artikel asli” saja yang saat ini saya sudah pahami. Cerita seperti di bawah inilah yang saya dapatkan :

Jika salah satu / beberapa artikel di blog anda di-“copas” dan anda merupakan penulis asli dari artikel-artikel tersebut, maka semua artikel hasil “copas” oleh blog-blog lain tidak akan ditampilkan. Sekuat dan se-tenar apa pun blog yang melakukan “copas” tersebut di dunia maya, tidak ada pengaruhnya. Tetapi, anda harus yakin, bahwa blog milik anda tidak pernah melakukan pelanggaran hak cipta, apalagi hingga masuk dalam daftar DMCA.

Kalaupun artikel hasil “copas”-an bisa ditemukan di Google SERP, maka ada “kemungkinan” akan dimasukkan dalam kategori berbeda. Saya pernah mendapatkannya dengan kondisi seperti itu. Misalnya, salah satu artikel saya yang bertema listrik di-“copas”, maka artikel hasil “copas”-an nya akan muncul di kategori non listrik dari hasil pencarian dengan kata kunci yang berbeda.

Memang tidak selalu akan muncul di tema dengan jalur kategori berbeda, tetapi yang pasti, artikel hasil “copas”-an tersebut tidak akan muncul berbarengan dengan artikel aslinya.

Salah satu contohnya adalah seperti di bawah ini :

Gambar 1 : Screen-shot artikel “copas” (kiri) dengan artikel asli (kanan).

Gambar di atas adalah hasil capture-screen (screen-shot) yang saya kerjakan kemarin (31 Oktober 2014). Disitu, jika anda perhatikan, ada perbedaan antara artikel asli (kanan) dengan artikel “copas”-an (kiri) pada dua paragraf sebelum gambar. Saya memang memiliki kebiasaan untuk meng-update artikel yang sudah ada tanpa mengenal waktu.

Ketika artikel “copas”-an itu saya ketahui keberadaannya, update artikel aslinya sudah saya kerjakan. Saya tidak memerhatikan saat pertama kali dipublikasikan, artikel hasil “copas” itu telah me-notifikasi-kan keberadaannya (20 Juni 2014) kepada saya. Baru ketika tanggal 30 Oktober 2014, notifikasi kembali saya terima dan saya baru mulai menaruh perhatian atas keberadaannya.

Nah, anda dapat melihat hasil Google SERP di bawah yang saya ambil kemarin (31 Oktober 2014) dengan menggunakan dua kata kunci yang hampir sama. Kata kunci pertama menyertakan kata “Tata” di awal kata kunci, lainnya tidak :

Gambar 2 : Screen-shot hasil SERP dua artikel di atas dengan dua kata kunci yang hampir sama.

Hasil di Google SERP itu memperlihatkan tidak ada masalah dengan tindakan update artikel yang saya kerjakan sebelumnya. Artikel asli tetap dimunculkan di halaman pertama walau pun menggunakan 90% unsur kata kunci yang semestinya dimiliki oleh artikel hasil “copas”-an.

Saya mencoba beberapa kombinasi kata kunci berdasarkan judul artikel “copas”-an (yang memang sengaja diubah oleh si pen-“copas”) tersebut. Hasilnya, kedua artikel tetap tidak pernah muncul berbarengan dalam satu kata kunci pencarian. Bahkan, sebagian besar kombinasi kata kunci yang digunakan, beralih merujuk ke artikel milik saya.

Mengapa bisa demikian? Apakah Google menyimpan “log” (rekaman jejak perubahan) yang dilakukan oleh setiap blog / situs? Bisa jadi. Mungkin itu sebabnya Google menambahkan dukungan “cache-server” (kira-kira diaktifkan pada pertengahan 2012) untuk menyempurnakan kinerja mesin pencarinya.

Jadi, algoritma Pirate 2.0 ini hanya meniadakan duplikasi di daftar hasil pencarian kata kunci. Saya belum menemukan apakah ada atau tidaknya tindakan / sanksi terhadap artikel “copas”-an seperti contoh diatas.

Mengapa saya menaruh perhatian cukup besar untuk hal-hal seperti ini?

Dulu, setiap kali ditemukan kasus seperti diatas, ada kecenderungan artikel asli akan “disingkirkan” dari daftar hasil Google SERP. Hal itu bisa terjadi karena ada anggapan bahwa pelaku pen -“copas”- an merupakan orang yang sama dengan pemilik artikel asli. Umumnya, pemilik artikel asli yang melakukan tindakan seperti itu bertujuan semata-mata hanya untuk menaikkan peringkat blog / situs -nya di daftar Google SERP.

Selain disingkirkan dari hasil Google SERP, salah satu blog / situs yang mem-publikasi-kan artikel tersebut akan di kucil-kan. Istilah keren-nya adalah di-“Google Sandbox”-kan. Kriteria penilaian yang diambil berdasarkan tingkat frekuensi aktivitas update artikel dari salah satu blog. Sungguh menyedihkan seandainya hal seperti itu terjadi pada pemilik artikel asli yang memang kurang aktif mengurus blog -nya, disingkirkan oleh artikelnya sendiri yang di-“copas” blog lain dengan pemilik berbeda.

Sekarang, hal seperti itu tidak akan pernah terjadi tanpa ada pelaporan tindak pelanggaran hak cipta ke DMCA (Digital Millennium Copyright Act) dari pemilik artikel asli. Laporan yang masuk ke DMCA itu menjadi dasar untuk “menurunkan” (takedown) artikel “copas”.

Tetapi, hal tersebut tidak secara otomatis ikut meng-update (menghapus) dari daftar hasil Google SERP. Akibatnya, seringkali kita menemukan nama blog / situs di halaman hasil mesin pencari yang sudah lenyap keberadaannya. Mungkin, kondisi seperti ini juga yang hendak di minimalisir dengan keberadaan algoritma Pirate 2.0. Kinerja yang dihasilkan pun terlihat cukup besar, karena efeknya ikut berimbas pada blog-blog aktif yang memiliki artikel dengan kesamaan konten.

Saat ini, saya masih belum berniat mengambil tindakan apapun atas tindak pen-“copas”-an sebagaimana terlihat pada lampiran screen-shot diatas. Saya akan membiarkannya untuk sementara waktu, sambil melihat sejauh mana reaksi dan kinerja algoritma Pirate 2.0 atas kasus seperti ini. Setidaknya bisa berguna sebagai “contoh kasus” tanpa perlu banyak usaha dan tanpa efek negatif yang harus saya tanggung.

Semoga bermanfaat!

Pirate 2.0 : algoritma anti pembajakan Google SE

Menyukai ini:

Terkait

Diterbitkan oleh Omar Ramlee

Pirate 2.0 : algoritma anti pembajakan Google SE

Shared :

Menyukai ini:

Terkait

Diterbitkan oleh Omar Ramlee

Eksplorasi konten lain dari Listrik di Rumah