בלוג קידום אתרים, שיווק ופרסום באינטרנט ובמנועי חיפוש


כל העמודים באינדקס של גוגל, חוץ מהעמוד הראשי - מה עושים? במסגרת ייעוץ חינם.

לפני כחודש קיבלתי פניה מבחור בשם אבירם שטען כי גוגל מאנדקסים את כל העמודים באתר www.ontv.co.il מלבד העמוד הראשי:

גוגל אינדקס את כל הכתובות באתר שלי
חוץ מהעמוד הראשי (האתר פתוח חודש וחצי ואני מקדם בכל דרך)


אני באמת מיואש…

התחלתי לבדוק את האתר מהקל לכבד:

1. טגי META - נראו תקינים
2. קובץ ROBOTS - נראה תקין
3. תוכן HTML - לא לפרס פוליצר אבל בסדר
4. ואלידציה של HTML - ציון עובר, לא משהו קריטי
5. תוכן משוכפל - תקין
6. כותרות HTTP - או! פה היתה הבעיה, ואני ארחיב:

בדקתי את הכותרת שמחזיר השרת בעזרת אחד מהשירותים שנותנים שרות זה וראיתי כי התוכן שמוחזר הינו מוזר ביותר:

status: 302 Found
Date: Sun, 19 Aug 2007 09:05:21 GMT
Server: Apache/1.3.37 (Unix) mod_ssl/2.8.28 OpenSSL/0.9.8d PHP/4.4.6 FrontPage/5.0.2.2510
X-Powered-By: PHP/4.4.6
Set-Cookie: PHPSESSID=3d4c892fbd305d7c215b9736af4fe1c3; path=/
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Set-Cookie: mainchan=4; expires=Thu, 13 Dec 2007 02:52:01 GMT
Location: index.php
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html

ניתן לראות כי הכותרת המוחזרת היא FOUND 302 - במצב זה, לא מתבצע REDIRECT אמיתי אלא השרת פשוט מביא את התוכן ממקור אחר. לכאורה, במקרה הזה הסיפור לא כזה גדול כי השימוש שנעשה בטג היה תמים - הצגת התוכן מהקובץ INDEX.PHP כאשר פונים לדומיין (הדרך הנכונה לעשות זאת היא באמצעות הגדרת ברירת מחדל נכונה באיפיוני שרת הווב). אבל, וזה אבל גדול - כותרת זו (FOUND 302) הינה אחד מהחטאים הגדולים ביותר מבחינת המנועים שכן בעזרתה ניתן להציג תוכן מאתר אחר (page jacking).

משנמצאה הבעיה, כל שנישאר הוא למצוא את המקור - בהתחלה חששתי כי קובץ ה - HTACCESS אחראי לזה או קוד ה - PHP, אולם התברר כי קוד ה - HTACCESS היה תקין ולבסוף אבירם מצא ותיקן את הקוד הבעייתי בעזרת המתכנת שלו.

וראו זה פלא - העמוד הראשי נמצא עכשיו בגוגל! (חפשו site:ontv.co.il בגוגל)

לבסוף המלצתי לאבירם לדאוג גם שהלינקים הפנימיים לעמוד הראשי יהיו לינקים לדומיין ולא ל - INDEX.PHP ולעשות REDIRECT 301 מ - INDEX.PHP לדומיין כדי למנוע תוכן משוכפל.

העזרה לאבירם התבצעה דרך פורום קידום האתרים.

אזכיר שוב ואומר כי ניתן לפנות אלי ולקבל ייעוץ חינם, אבקש רק לפנות בשאלות לא סטנדרטיות, מאתגרות ומעניינות שיכולות לעזור לקהל הקוראים.

נהנתם? שתפו את חבריכם:
  • סמניות גוגל
  • טע.י.ם. לי
  • HOTחדש
  • שווה קריאה

נהניתם מהפוסט? קבלו עדכונים ברסס

תגובה אחת לפוסט ”כל העמודים באינדקס של גוגל, חוץ מהעמוד הראשי - מה עושים? במסגרת ייעוץ חינם.“

  1. מאת זיפות גגות:

    באיזה תוכנה אתה משתמש לבדיקת תוכן משוכפל ? האם אתה יכול לרשוםם על זה פוסט…

לכתוב תגובה