شرکت گوگل در رابطه با ماهیت فعلی اینترنت، اطلاعات جالبی را به اشتراک گذاشته است. غول جستجوگر در جریان برگزاری رویداد Google Search Central Live در کشور سنگاپور اعلام کرد که بیش از نیمی از کل دادههای موجود در وب دارای ماهیت تکراری هستند. به بیان دقیقتر حدودا 60 درصد محتوای اینترنت دارای ماهیت کپیبرداری شده است.
در عینحال بهنظر میرسد که وضعیت کنونی صرفا از کپیبرداری دادهها و قرار دادن آنها در جای دیگر ناشی نمیشود. این پدیده عمدتا از تنظیمات مختلف سایتهایی ناشی میشود که در آنها کپی وجود دارد. با اینحال گوگل برای حل مشکل تکراری بودن دادهها راهکارهایی را به شرح زیر پیشنهاد نموده است:
- پروتکلهای تکراری را حذف نموده و ترجیحا از HTTPS استفاده کنید
- حذف گزینه www/non-www
- حذف آدرسهای URL با پارامترهای بلا استفاده
- حذف گزینه slash/no slash
- حذف سایر Checksumهای تکراری
تمامی این موارد به بهینهسازی بهتر منابع و عملکرد بهتر و سریعتر موتورهای جستجو در سایتها کمک میکنند.