گوگل از حدود 40 سیگنال برای تعیین URL های متعارف استفاده می کند
در قسمت اخیر پادکست Search Off the Record Google، آلن اسکات از تیم “Dups” توضیح داد که چگونه Google تصمیم می گیرد کدام URL را به عنوان URL اصلی در نظر بگیرد. وقتی صفحات تکراری وجود دارد.
او فاش کرد که Google به حدود 40 سیگنال مختلف نگاه می کند تا URL اصلی را از گروهی از صفحات مشابه انتخاب کند.
حدود 40 سیگنال برای انتخاب URL متعارف
محتوای تکراری یک مشکل رایج برای موتورهای جستجو است زیرا بسیاری از وب سایت ها دارای چندین صفحه با محتوای یکسان یا مشابه هستند.
برای حل این مشکل، Google از فرآیندی به نام canonicalization استفاده میکند. این فرآیند به Google اجازه میدهد یک URL را به عنوان نسخه اصلی برای فهرستبندی و نمایش در نتایج جستجو انتخاب کند.
Google اهمیت استفاده از سیگنالهایی مانند برچسبهای rel=”canonical”، نقشههای سایت و تغییر مسیرهای 301 را برای متعارفسازی مورد بحث قرار داده است. با این حال، تعداد سیگنالهای درگیر در این فرآیند بیش از آن چیزی است که انتظار دارید.
اسکات در طول پادکست فاش کرد:
“در حال حاضر مطمئن نیستم که عدد دقیق چقدر است زیرا بالا و پایین می شود، اما گمان می کنم جایی در همسایگی 40 باشد.”
برخی از سیگنال های شناخته شده ذکر شده عبارتند از:
- rel=”canonical” برچسبها
- 301 تغییر مسیر
- HTTPS در مقابل HTTP
- نقشه های سایت
- پیوند داخلی
- طول URL
وزن و اهمیت هر سیگنال ممکن است متفاوت باشد، و برخی از سیگنالها، مانند برچسبهای rel=”canonical” میتوانند بر فرآیند خوشهبندی و متعارفسازی تاثیر بگذارند.
سیگنال های متعادل کننده
با سیگنالهای زیاد، آلن به چالشها در تعیین URL متعارف در هنگام تداخل سیگنالها اذعان داشت.
او اظهار داشت:
“اگر سیگنالهای شما با یکدیگر تضاد داشته باشند، اتفاقی که قرار است بیفتد این است که سیستم شروع به بازگشت به سیگنالهای کمتر خواهد کرد.”
این بدان معناست که اگرچه سیگنالهای قوی مانند تگهای rel=”canonical” و تغییر مسیرهای 301 بسیار مهم هستند، زمانی که این سیگنالها نامشخص یا متناقض باشند، عوامل دیگری میتوانند نقش داشته باشند.
در نتیجه، فرآیند متعارف سازی Google شامل یک عمل متعادل کننده ظریف برای تعیین مناسب ترین URL متعارف است.
بهترین روشها برای متعارف سازی
سیگنالهای پاک به Google کمک میکنند تا URL معمولی ترجیحی را شناسایی کند.
بهترین شیوه ها عبارتند از:
- از تگ های rel=”canonical” به درستی استفاده کنید.
- 301 تغییرمسیر را برای محتوای جابجا شده دائمی اجرا کنید.
- مطمئن شوید که نسخههای HTTPS صفحات قابل دسترسی و پیوند هستند.
- نقشههای سایت را با URLهای معمولی ترجیحی ارسال کنید.
- پیوندهای داخلی را ثابت نگه دارید.
این سیگنالها به Google کمک میکنند تا URLهای متعارف صحیح را پیدا کند و خزیدن، نمایهسازی و دید جستجوی سایت شما را بهبود بخشد.
اشتباهاتی که باید اجتناب کرد
در اینجا چند اشتباه رایج وجود دارد که باید مراقب آنها باشید.
1. برچسب های متعارف نادرست یا متضاد:
- اشاره به صفحه غیرموجود یا 404 صفحه
- چند برچسب متعارف با URL های مختلف در یک صفحه
- به طور کامل به دامنه دیگری اشاره می کند
اصلاح: تگهای متعارف را دوباره بررسی کنید، فقط از یک در هر صفحه استفاده کنید و از نشانیهای اینترنتی مطلق استفاده کنید.
2. زنجیره ها یا حلقه های متعارف
وقتی صفحه A به صفحه B به عنوان متعارف اشاره می کند، اما صفحه B به A یا صفحه دیگری اشاره می کند و یک حلقه ایجاد می کند.
رفع: اطمینان حاصل کنید که URLهای متعارف همیشه به نسخه نهایی و ترجیحی صفحه اشاره می کنند.
3. استفاده از تگ های noindex و canonical با هم
ارسال سیگنال های ترکیبی به موتورهای جستجو. Noindex به این معنی است که صفحه را به هیچ وجه ایندکس نکنید، و canonicalها را نامربوط کنید.
رفع: از برچسبهای متعارف برای ادغام و از noindex برای حذف استفاده کنید.
4. متعارف سازی برای تغییر مسیر یا صفحات بدون فهرست
اشاره دادن به موارد متعارف به صفحات هدایت شده یا بدون فهرست موتورهای جستجو را سردرگم می کند.
اصلاح: نشانیهای اینترنتی متعارف باید دارای 200 وضعیت و قابل نمایهسازی باشند.
5. نادیده گرفتن حساسیت حروف کوچک
حروف متن ناسازگار URL میتواند باعث مشکلات محتوای تکراری شود.
رفع: URL و حروف برچسب متعارف را ثابت نگه دارید.
6. نادیده گرفتن صفحه بندی و پارامترها
محتوای صفحهبندی شده و آدرسهای اینترنتی پر پارامتر میتوانند در صورت استفاده نادرست باعث تکرار شوند.
اصلاح: از برچسبهای متعارفی که به صفحه اول اشاره میکنند یا «مشاهده همه» برای صفحهبندی استفاده کنید و پارامترها را ثابت نگه دارید.
موارد مهم
بعید است فهرست کامل بیش از 40 سیگنال مورد استفاده برای تعیین URLهای متعارف در دسترس عموم قرار گیرد.
با این حال، این هنوز یک بحث روشنگر بود که ارزش برجسته کردن را داشت.
این موارد کلیدی است:
- Google از تقریباً 40 سیگنال مختلف برای تعیین نشانیهای اینترنتی متعارف استفاده میکند که تگهای rel=”canonical” و 301 تغییر مسیر یکی از قویترین شاخصها هستند
- هنگامی که سیگنالها با هم تداخل دارند، Google برای تصمیمگیری از سیگنالهای ثانویه استفاده میکند
- اجرای واضح و مداوم سیگنالهای متعارف (برچسبها، تغییر مسیرها، نقشههای سایت، پیوندهای داخلی) بسیار مهم است
- اشتباهات رایج مانند زنجیرههای متعارف، سیگنالهای ترکیبی، یا پیادهسازیهای نادرست میتوانند موتورهای جستجو را سردرگم کنند