اخبار

جستجوی Google تحت تأثیر حملات گسترده هرزنامه قرار گرفت

نتایج جستجوی Google در چند روز گذشته مورد حمله هرزنامه قرار گرفته است، چیزی که می توان آن را کاملاً خارج از کنترل توصیف کرد. بسیاری از دامنه ها هر کدام برای صدها هزار کلمه کلیدی رتبه بندی می شوند، که نشان می دهد مقیاس این حمله می تواند به راحتی به میلیون ها عبارت کلیدی برسد.

با کمال تعجب، بسیاری از دامنه ها فقط در 24-48 ساعت گذشته ثبت شده اند.

این موضوع اخیراً از طریق مجموعه ای از پست های بیل هارتزر (LinkedIn پروفایل) جایی که او نمودار پیوند ایجاد شده توسط ابزار بک لینک Majestic را منتشر کرد که شبکه های پیوند چندین سایت هرزنامه را در معرض دید قرار داد.

گراف پیوندی که او ارسال کرد تعداد زیادی از وب سایت ها را نشان می دهد که به طور محکم با یکدیگر پیوند دارند، که الگوی نسبتاً معمولی برای شبکه های پیوند هرزنامه است.

صفحه نمایش شبکه بهم پیوسته

Google Search Overwhelmed By Massive Spam Attack

من و بیل در مورد سایت‌های هرزنامه از طریق پیام‌رسان فیس‌بوک صحبت کردیم و هر دو موافق بودیم که اگرچه ارسال‌کنندگان هرزنامه تلاش زیادی برای ایجاد یک شبکه بک لینک انجام دادند، اما پیوندها در واقع مسئول رتبه‌بندی بالا نیستند.

بیل گفت:

“به نظر من این تا حدودی تقصیر گوگل است که به نظر می رسد بیشتر بر محتوا تاکید می کند تا پیوندها.”

من 100% موافقم که گوگل بیشتر بر محتوا تاکید می کند تا پیوندها. اما فکر من این است که پیوندهای هرزنامه وجود دارد تا Googlebot بتواند صفحات هرزنامه را کشف کند و آنها را فهرست کند، حتی اگر فقط برای یک یا دو روز باشد.

هنگامی که صفحات هرزنامه ایندکس می‌شوند، احتمالاً از دو حفره در الگوریتم‌های Google استفاده می‌کنند که در ادامه در مورد آن صحبت خواهم کرد.

هرزنامه خارج از کنترل در Google SERPs

چندین سایت برای عبارات طولانی رتبه بندی می شوند که رتبه بندی آنها تا حدودی آسان است، و همچنین عباراتی با مؤلفه جستجوی محلی، که رتبه بندی آنها نیز آسان است.

عبارات دم بلند عبارت‌های کلیدواژه‌ای هستند که توسط افراد استفاده می‌شوند اما بسیار نادر هستند. Longtail مفهومی است که تقریباً بیست سال است که وجود داشته و متعاقباً توسط کتابی به نام The Long Tail در سال 2006 رایج شد: چرا آینده کسب و کار فروش کمتری دارد.

ارسال‌کنندگان هرزنامه می‌توانند برای این عباراتی که به ندرت جستجو می‌شوند رتبه‌بندی کنند، زیرا رقابت کمی برای آن عبارات وجود دارد که رتبه‌بندی را آسان می‌کند.

بنابراین، اگر یک هرزنامه‌نویس میلیون‌ها صفحه عبارات طولانی ایجاد کند، آن صفحات می‌توانند هر روز برای صدها هزار کلمه کلیدی در مدت زمان کوتاهی رتبه‌بندی شوند.

شرکت‌هایی مانند آمازون از اصل دم بلند برای فروش صدها هزار محصول جداگانه در روز استفاده می‌کنند که با فروش صدها هزار بار در روز یک محصول متفاوت است.

این همان چیزی است که ارسال‌کنندگان هرزنامه از آن سوء استفاده می‌کنند، سهولت رتبه‌بندی عبارات طولانی.

دومین چیزی که هرزنامه‌ها از آن سوء استفاده می‌کنند، حفره‌ای است که در جستجوی محلی وجود دارد.

الگوریتم جستجوی محلی با الگوریتم رتبه بندی کلمات کلیدی غیرمحلی یکسان نیست.

نمونه‌هایی که آشکار شده‌اند، انواعی از Craigslist و کلمات کلیدی مرتبط هستند.

نمونه‌هایی عبارت‌اند از عباراتی مانند قطعات خودرو Craigslist، اتاق‌های کریگ‌لیست برای اجاره، Craigslist برای فروش توسط مالک و هزاران کلمه کلیدی دیگر، بیشتر که از کلمه Craigslist استفاده نمی کنند.

مقیاس هرزنامه بسیار زیاد است و بسیار فراتر از کلمات کلیدی با کلمه “Craigslist” در آن است.

صفحه هرزنامه چگونه است

نگاهی به ظاهر صفحه هرزنامه با بازدید از صفحات با مرورگر غیرممکن است.

من سعی کردم کد منبع سایت‌هایی را که در گوگل رتبه‌بندی می‌شوند ببینم، اما همه سایت‌های هرزنامه به طور خودکار به دامنه دیگری هدایت می‌شوند.

در مرحله بعد URL هرزنامه را در جستجوگر پیوند W3C برای بازدید از وب سایت وارد کردم اما ربات W3C نیز نتوانست سایت را ببیند.

بنابراین من عامل کاربر مرورگرم را تغییر دادم تا خود را به عنوان Googlebot معرفی کنم اما سایت هرزنامه همچنان مرا هدایت کرد.

این نشان می‌دهد که سایت بررسی نمی‌کند که آیا عامل کاربر Googlebot است یا خیر.

سایت هرزنامه در حال بررسی آدرس های IP Googlebot بود. اگر آدرس IP بازدیدکننده به عنوان متعلق به Google مطابقت داشت، صفحه هرزنامه محتوا را به Googlebot نمایش می‌دهد.

همه بازدیدکنندگان دیگر به دامنه‌های دیگری که محتوای ناقص را نمایش می‌دهند هدایت شدند.

برای دیدن HTML وب سایت، مجبور شدم با یک آدرس IP Google از آن بازدید کنم. بنابراین من از آزمایش‌کننده نتایج غنی Google برای بازدید از سایت هرزنامه و ضبط HTML صفحه استفاده کردم.

من به بیل هارتزر نشان دادم که چگونه HTML را با استفاده از تست کننده Rich Results استخراج کند و او بلافاصله در مورد آن توییت کرد، lol. دنگ!

Rich Results Tester گزینه ای برای نمایش HTML یک صفحه وب دارد. بنابراین HTML را کپی کرد، آن را در یک فایل متنی جایگذاری کرد و سپس آن را به عنوان یک فایل HTML ذخیره کرد.

نمایش HTML ارائه شده توسط Rich Results Tool

Google Search Overwhelmed By Massive Spam Attack

در مرحله بعد فایل HTML را برای حذف هر جاوا اسکریپت ویرایش کردم و سپس فایل را دوباره ذخیره کردم.

اکنون توانستم ببینم صفحه وب برای Google چگونه است:

عکس صفحه وب هرزنامه

Screenshot of a spam webpage that ranks in Google

رتبه یک دامنه برای بیش از 300000 کلمه کلیدی

بیل صفحه‌گسترده‌ای حاوی فهرستی از عبارات کلیدی را برای من فرستاد که فقط یکی از سایت‌های هرزنامه رتبه‌بندی شده است. یک سایت هرزنامه، فقط یکی از آنها، برای بیش از 300000 عبارت کلیدی رتبه بندی شده است.

نمایش اسکرین شات کلمات کلیدی برای یک دامنه

Image showing a closeup of a spreadsheet with keyword phrases on it

عبارات کلیدی Craigslist زیادی وجود داشت اما عبارات طولانی دیگری نیز وجود داشت که بسیاری از آنها حاوی یک عنصر جستجوی محلی بودند. همانطور که اشاره کردم، رتبه‌بندی برای عبارات طولانی، رتبه‌بندی برای عبارات جستجوی محلی و ترکیب این دو نوع عبارت آسان است و رتبه‌بندی برای این عبارات کلیدی واقعاً آسان است.

چرا این تکنیک هرزنامه کار می کند؟

جستجوی محلی از الگوریتم متفاوتی نسبت به الگوریتم غیر محلی استفاده می کند. به عنوان مثال، یک سایت محلی، به طور کلی، برای رتبه بندی یک پرس و جو نیازی به لینک های زیادی ندارد. صفحات فقط به انواع کلمات کلیدی مناسب نیاز دارند تا یک الگوریتم جستجوی محلی را راه اندازی کنند و آن را برای یک منطقه جغرافیایی رتبه بندی کنند.

بنابراین، اگر «قطعات خودکار Craigslist» را جستجو کنید، الگوریتم جستجوی محلی راه‌اندازی می‌شود و به دلیل طولانی بودن آن، رتبه‌بندی آن زیاد طول نمی‌کشد.

این یک مشکل مداوم برای سال‌هاست. چندین سال پیش یک وب‌سایت توانست رتبه‌بندی «Rhinoplasty Plano, Texas» را با سایتی که حاوی مطالب لاتین رومی قدیمی و عناوین به زبان انگلیسی بود، کسب کند. رینوپلاستی یک جستجوی محلی است و پلانو، تگزاس یک شهر نسبتا کوچک است. رتبه بندی آن عبارت کلیدی جراحی بینی به قدری آسان بود که وب سایت لاتین زبان توانست به راحتی برای آن رتبه بندی کند.

Google حداقل از 19 دسامبر در مورد این مشکل هرزنامه اطلاع داشته است، همانطور که در توییتی توسط دنی سالیوان تایید شده است.

دیدن اینکه آیا گوگل بالاخره پس از این مدت زمان راهی برای مبارزه با این نوع هرزنامه ها پیدا می کند، جالب خواهد بود.

 

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا