בלוג קידום אתרים, שיווק ופרסום באינטרנט ובמנועי חיפוש


מה זה robots.txt ?

חמישי, 24 ביולי 2008

למרות שרבים מבעלי האתרים והבלוגים יודעים מה זה robots.txt, שמתי לב כי ישנם מספר ניואנסים ושאלות החוזרות על עצמן בנושא, אפילו ע”י וובמסטרים מנוסים. בפוסט זה אני אנסה לסכם את הנושא, כמו גם להוסיף מספר הדגשים חשובים. משתמשים מנוסים ימצאו את החלק הראשון טריוויאלי, אבל אני ממליץ בחום לקרוא את החלק השני הכולל את ההדגשים.

robots.txt הינו קובץ טקסט, בפורמט מוסכם, שמאפשר לוובמסטר לתת הנחיות לבוטים (ספיידרים של מנועי החיפוש), לגבי חלקי אתר שאליהם נאסר עליו להכנס. כאשר מנוע רוצה להכנס לאתר www.your-site.com, הוא קודם כל פונה ל - www.your-site.com/robots.txt ומנסה למצוא בו אינפורמציה הנוגעת לו ספציפית, ואם לא קיימת כזו, אינפורמציה הנוגעת לכלל הבוטים.

את הקובץ יש ליצור באמצעות עורך טקסט פשוט, כגון notepad, ולהעלותו לספריה הראשית של האתר.

פורמט הקובץ הינו מקטעים של הנחיות הבנויים מ:
1. שם הבוט - כאן ניתן לספק שם ספציפי, או * כדי לייצג את כל הבוטים.
2. רשימת ספריות אליהן אסור להכנס.
 

דוגמה 1 - מניעה מכל הבוטים להכנס לכל הספריות והקבצים באתר: 

User-agent: *
Disallow: /

דוגמה 2 - מתן אפשרות לכל הבוטים להכנס לכל הספריות והקבצים באתר:

User-agent: *
Disallow:

דוגמה 3 - מניעה מכל הבוטים להכנס לשתי ספריות ספציפיות באתר:

User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/

דוגמה 4 - מניעה מבוט ספציפי להכנס להכנס לכל הספריות והקבצים באתר:

User-agent: BadBot
Disallow: /

דוגמה 5 - מתן אפשרות רק לגוגל להכנס לכל הספריות והקבצים באתר. כל שאר הבוטים - חסומים.

User-agent: Google
Disallow:

User-agent: *
Disallow: /

דוגמה 6 - מניעת כניסה לקובץ ספציפי:

User-agent: *
Disallow: /~joe/junk.html

הדגשים:

1. קובץ ה - robots.txt אינו מונע כניסה לספריות והקבצים! הבוט יכול לבחור אם למלא את ההנחיות או לא. כמובן שהבוטים של המנועים הגדולים ממלאים אחר ההנחיות, אבל חשוב לזכור שלא מדובר במניעה טכנית מהבוט להכנס.

2. בהמשך ישיר ל - 1, אומנם הקובץ ימנע כניסה, אולם, אם קיים לינק ישיר ממקור אחר לקובץ שאנחנו מעוניינם לחסום - מנועי החיפוש יוכלו להוסיף אותו לאינדקס שלהם באמצעות המידע שיאספו מהעמוד שמכיל את הלינק.

3. הבוטים יחפשו קודם כל הנחיות ספציפיות המיועדות להם - אם קיימות הנחיות כאלו, הם ימלאו אחר הנחיות אלו בלבד ויתעלמו מהשאר.

4. גם אם אין ברצונכם למנוע מהבוטים להכנס לספריות מסויימות, אני ממליץ להעלות קובץ robots.txt המאפשר כניסה לכל הבוטים (דוגמה 2 למעלה), וזאת כדי למנוע מצב הקיים ברבות מפטלפורמות בנית האתרים, היוצרות עמוד ברירת מחדל לכל עמוד שאינו בנמצא (ניתן לקורא על כך בפוסט הזה), מה שעלול לבלבל את מנועי החיפוש ולמנוע אינדוקס תקין של האתר.

נהנתם? שתפו את חבריכם:
  • טע.י.ם. לי
  • חפרן
  • HOTחדש
  • שווה קריאה
  • StumbleUpon
  • Technorati

כיצד לזהות תוכן משוכפל - רשימת כלים חינמיים

שני, 14 ביולי 2008

הנושא של תוכן משוכפל, בגלל חשיבותו הרבה, נטחן רבות בבלוג זה בעבר, ולכן אינני רוצה לשוב ולדון בנושא עצמו, אלא רק לחלוק עמכם מספר כלים למציאת תוכן משוכפל. בסוף הפוסט, אוסיף גם לינקים לפוסטים קודמים לגבי תוכן משוכפל למי שעוד לא קרא. חשיבות הכלים הללו רבה מכיוון שרוב הבלוגים היום, וגם רבים מהאתרים, נבנים בצורה אוטומטית ע”י תוכנות ניהול תוכן שונות (כגון וורדפרס), והשליטה שלנו איננה מלאה, ולא תמיד אנחנו יודעים מה קורה ברקע.

הנה רשימת הכלים, עם הסבר קצר ואופן השימוש:

1. גוגל וובמסטרס -  ליחצו על Diagnostics -> Content analysis ותקבלו את העמוד הבא, שמצביע על תוכן משוכפל ב- meta description  ו -meta title:

כלים לזיהוי תוכן משוכפל

לחיצה על אחד האייטמים הבעיתיים, תוביל לעמוד הבא, בו ניתן לראות במדויק את תוכן ה - meta המשוכפל, כמו גם את העמודים הספציפיים הבעיתיים, הדורשים תיקון:

כלים לזיהוי תוכן משוכפל
2. www.virante.com - מנתח מספר אלמנטים, כמו הפניית 301. שימו לב כי בבלוג שלי גם קיימת בעיה - אני לא עושה הפניית 301 מ - index.php לדומיין הראשי, מה שעלול ליצור בעיות:

כלים לזיהוי תוכן משוכפל

3. www.copyscape.com - כלי שמחפש תוכן זהה לאתר שלך ברשת - נסו את הבלוג שלי ותראו כי רוב התוכן המשוכפל הינו מאמרים שלי באתרי מאמרים שונים בארץ. (ספציפית למקרה זה אין צורך לדאוג - הנה ההסבר).

אני ממליץ להשתמש בכלים אלו מדי פעם, ובמיוחד לאחר עדכון גירסה של וורדפרס או כל תוכנת ניהול תוכן אחרת. אשמח לשמוע אם ישנם עוד כלים בהם ניתן לעשות שימוש דומה.

הנה קריאה נוספת מומלצת בנוגע לתוכן משוכפל:

תוכן משוכפל וקישורי 301 ו - 302

כיצד להשתמש בתקצירי וורפרדס למניעת תוכן משוכפל וזירוז הטעינה

האם לחסום פידים ע”י NOINDEX כדי למנוע תוכן משוכפל?

נהנתם? שתפו את חבריכם:
  • טע.י.ם. לי
  • חפרן
  • HOTחדש
  • שווה קריאה
  • StumbleUpon
  • Technorati

טגי התמונות - Alt מול Title

רביעי, 04 ביוני 2008

שאלה שעולה שוב ושוב נוגעת להבדל שבין טג התמונות alt מול ה - title, ואני מקבל את הרושם שבעלי אתרים רבים אינם מבחינים בין שני הטגים. נתקלתי באותה שאלה גם בבלוג הוובמסטרס של גוגל ולכן החלטתי לפרט בנושא גם פה כדי לעשות סדר:

Alt Text  - שימושו הראשי הוא לספק מידע אלטרנטיבי (alternate) לתמונה שלא נטענה עקב אחד מהמקרים הבאים:
1. המשתמש ביטל את השימוש בתמונות בדפדפן.
2. התמונה לא קיימת, מכל סיבה שהיא.
3. דפדפנים המיועדים למתקשים בראיה משתמשים בטג זה להשמעת תאור התמונה.
אי לכך, טג זה אמור לתאר את התמונה ולעזור למשתמש לו התמונה לא נטענה להבין במה מדובר. מבחינת אופטימיזציה, טג ה - alt הינו הטג המרכזי אותו בודק גוגל בהקשר לתמונה (מתוך גוגל וובמסטרס סנטרל).

Title - טג זה נותן אפשרות לבעל האתר לחלוק מידע נוסף הנוגע לתמונה, כאשר כל הכללים החלים על ה - title הראשי של האתר חלים גם כאן, כלומר עליו להיות תמציתי, קצר ורלוונטי לתמונה כמובן.

כמו כן, טגים אלו משמשים כ -tooltip כאשר עוברים על התמונה עם העכבר (תלוי דפדפן).

לסיכום, רצוי להשתמש בשני הטגים בצורה מושכלת, תוך שילוב מילות מפתח הרלוונטיות הן לתמונה הספציפית והן לתוכן העמוד.

קריאה נוספת:

שילוב תמונות בפוסטים - המדריך למתחיל

כיצד לנצל שיתוף וחיפוש תמונות לקידום אתר?

כיצד לנצל את חיפוש התמונות והוידאו בגוגל באופן אופטימלי - חלק שני

נהנתם? שתפו את חבריכם:
  • טע.י.ם. לי
  • חפרן
  • HOTחדש
  • שווה קריאה
  • StumbleUpon
  • Technorati

אופטימיזצית אתרי פלאש

ראשון, 09 במרץ 2008

flash_logoלא אחת אני נתקל בשאלות לגבי אופטימיזציה של אתרי פלאש, ובפוסט זה אנסה לסכם כמה טיפים עקרוניים לגבי אתרי פלאש, ששמירה עליהם תביא לתוצאות סבירות, למרות המגבלות הידועות. טיפים אלו ידועים כמובן זה מכבר ואף גוגל פירטו את הדרכים הרצויות לאופטימיזציה אתרי פלאש.

הבעיה:
אתרי פלאש נבנו עבור עין האדם. לבוטים של מנועי החיפוש אין עיניים, ולכן בלתי אפשרי עבורם לתרגם את המראה למילים בצורה יותר מסבירה. מנועי החיפוש יכולים אומנם להבין את הקישורים אולם אינן יכולים לקשר אותם לקונטקסט מסויים, שכן התוכן עצמו הינו מובנה בקבצי הפלאש עצמם. זו הסיבה שעל אף שאתרי פלאש רבים נמצאים באינדקסים השונים, יחסר למנוע מידע קונטקסטואלי רב לגבי האתר.

הפתרון:

1. שימוש בפלאש למטרה לה נועד - גרפיקה ואינטרקציה דינמית בלבד. אין כל מניעה לשלב קיטעי פלאש באתר, כאשר התוכן והקישורים נבנים ב - HTML ובפלאש נעשה שימוש רק היכן שיש לו יתרון על פני HTML. כך, אפשר להנות משני העולמות - האתר יהיה ידידותי הן למנועי החיפוש והן למשתמש (ניווט בלינקים רגילים קל הרבה יותר מאשר ניווט בפלאש לדוגמה), שיהנה מיתרונות נקודתיים של טכנולוגיית הפלאש.
2. כתיבת התוכן עצמו ב - HTML תוך שימוש של פלאש בשילוב ג’אווה סקריפט (sIFR לדוגמה) - כך, הטקסט זמין למנועי החיפוש אולם מוצג בתוך אובייקט הפלאש עצמו.
3. הצגת האתר כולו ב - HTML כברירת מחדל, תוך מתן אפשרות למשתמש להכנס לגירסת פלאש. לא רצוי להשתמש בעמוד מקדים המכיל רק קישור לשתי הגירסאות שכן עמוד שכזה יהיה חסר תוכן, ולכן עדיף להציג את גירסת ה - HTML המלאה כברירת מחדל בעמוד הבית.בכל מקרה, המידע שמוצג למשתמש חייב להיות זהה לחלוטין למידע המוצג למנוע החיפוש, שאם לא כן, מנועי החיפוש יחסמו את האתר. טקסט נסתר והעלמת קטעים באמצעות ג’אווה סקריפט הינן דוגמאות לטכניקות אסורות.

נהנתם? שתפו את חבריכם:
  • טע.י.ם. לי
  • חפרן
  • HOTחדש
  • שווה קריאה
  • StumbleUpon
  • Technorati

כיצד להגדיל תנועה לעמודי מוצרים

חמישי, 28 בפברואר 2008

בפוסט הקודם הקדמתי קצת את המאוחר והמלצתי כיצד לנהוג בעמודי מוצרים שכבר אינם מוצאים למכירה. מדוע הקדמתי את המאוחר? מכיוון שבדרך כלל, הבעיה עם עמודי מוצרים הינה חמורה בהרבה, שכן עמודי המוצרים עצמם נותרים מוזנחים בכל הנוגע לאופטימיזציה. אם נחשוב על כך מעט יותר לעומק, דווקא עמודים אלו הינם קלים לאופטימיזציה ומקור בלתי נדלה לתוכן רב, ואף עדכני.

הנה מספר נקודות שיש להקפיד עליהן בעמודי מוצרים כדי לנצל את מלוא כוחם:

1. תיאורי המוצרים - רבים מאתרי האי-קומרס, ואף הגדולים שביניהם בארץ, משתמשים כולם באותו תיאור מוצר - תיאור המוצר אותו קיבלו מהספק. שימוש שכזה יוביל לפגיעה במיקומים כתוצאה מתוכן משוכפל. רצוי להשקיע מעט בתיאור מקורי וייחודי של המוצר, כמו גם לשלב בו מילות מפתח רלוונטיות.

2. חוות דעת לקוחות - חוות דעת לקוחות הינן מקור בלתי נדלה לתוכן חדש ועדכני, החשוב מעין כמוהו למנועי החיפוש. כמו כן, לאחר בניית הפלטפורמה לכך, התוכן ייווצר באופן אוטומטי ע”י הלקוחות, ללא כל צורך בהשקעה קבועה והעסקת אנשי תוכן.

3. תמונות ווידאו - החיפוש האוניברסלי של גוגל פותח אין ספור אפשרויות לאופטימיזצית תמונות ווידאו. עמודי המוצרים מכילים תמונות, אז מדוע לא להשקיע מעט יותר ולוודא שהתמונות וקטעי הווידאו יהיו ידידותיים למנועי החיפוש גם כן? יותר מכך - ניתן לעודד את הלקוחות להעלות קטעי ווידאו בתור חוות הדעת למוצר:

החיפוש האוניברסלי של גוגל - והעיקר לא לפחד כלל

כיצד לנצל את חיפוש התמונות והוידאו בגוגל באופן אופטימלי

כיצד לנצל את חיפוש התמונות והוידאו בגוגל באופן אופטימלי - חלק שני

4. כתובות URL ידידותיות המכילות את שם המוצר - התייחסתי לכך כבר רבות בעבר בפוסט הבא:

כיצד להפוך כתובות דינמיות לכתובות ידידותיות (נקיות) למנועי החיפוש

כמובן שכל הנקודות הנ”ל צריכות להיות תוספת לכללי האופטימיזציה הבסיסיים, שגם עליהם פירטתי רבות בעבר:

אופטימיזציית אתר - האלף בית

נהנתם? שתפו את חבריכם:
  • טע.י.ם. לי
  • חפרן
  • HOTחדש
  • שווה קריאה
  • StumbleUpon
  • Technorati

כיצד לטפל בעמודים של מוצרים שכבר אינם בנמצא

רביעי, 20 בפברואר 2008

הפריט אינו במלאיאתרים מסחריים שמציעים רשת רחבה של מוצרים, ויותר מכך, רשת דינמית של מוצרים שמשתנים מדי יום, בעלי כתובות URL דינמיות, הם בד”כ אתרים קשי-אופטימיזציה באופן יחסי. זאת ועוד - אתרים אלו נתונים בד”כ למגבלות של תוכנות האי-קומרס, שלא כולן מאפשרות גמישות מספקת. הבעיה מחמירה כאשר בעל אתר שכזה אינו נותן דעתו לעמודים של מוצרים שכבר אינם בנמצא.

הפתרונות של רבות מפלטפורמות האי-קומרס כוללים מספר אפשרויות, רובן ככולן מזיקות:

1. מחיקת העמוד עצמו כאשר המוצר כבר אינו מוצע יותר - כלומר, איבוד מיידי של תנועה לעמוד הספיציפי שהיינו מקבלים עד ליום מחיקתו.
2. החזרת עמודי 404 בעלי כותרת HTTP 200 - כלומר, מנוע החיפוש חושב שהעמוד קיים, אולם מקבל תוכן של 404, מה שמביא, לאחר זמן מה, להופעה של מאות עמודים (כמספר המוצרים שכבר אינם בנמצא) בעלי אותו תוכן של 404 במנועי החיפוש - תוכן משוכפל שיביא לבסוף לחסימת האתר כולו.
3. הפניית 301 לעמוד הראשי - הרע במיעוטו, אולם, אנו מאבדים במקרה הזה תנועה ממוקדת של חיפוש מוצר ספציפי, ולאורך זמן, האתר לא יופיע עוד במנועי החיפוש כתוצאה למילה הקשורה לאתר שכן העמוד הסופי אינו מכיל תוכן ספציפי למילה.

הפתרון הטוב ביותר במקרה הזה הינו פשוט ביותר - השארת העמוד כפי שהוא, ללא מחיקתו, כולל התוכן, טג ה - TITLE וכו’, וללא יצירת כל הפנייה שהיא. כמו כן, יש להקפיד על מספר נקודות נוספות:
1. יש לציין, כמובן, כי המוצר כבר אינו בנמצא. את ההודעה הזו רצוי לציין בצורה גרפית (תמונה), כדי שמנועי החיפוש לא יציגו בתוצאות החיפוש את העובדה שהמוצר כבר לא קיים, מה שיוריד משמעותית את כמות הלחיצות.
2. יש להציע מוצרים דומים למוצר המבוקש.
3. רצוי לספק למשתמש גם אפשרות לחיפוש. ניתן אף למלא מראש את שורת החיפוש במילת החיפוש בה השתמש המשתמש (ע”י בדיקת ה - referrer).

אם נקפיד על הנקודות הנ”ל, לא נפסיד תנועה בגלל מוצר שכבר אינו בנמצא, ויותר מכך - נגדיל את הסיכוי כמה שניתן שהמשתמש יבצע קניה אחרת באתר.

נהנתם? שתפו את חבריכם:
  • טע.י.ם. לי
  • חפרן
  • HOTחדש
  • שווה קריאה
  • StumbleUpon
  • Technorati

כיצד אני מגדיל את החשיפה של פוסטים ישנים במנועי החיפוש

חמישי, 24 בינואר 2008

הדעה הרווחת היא שברגע שהסתיימה כתיבת הפוסט אין כל צורך לשנות את התוכן ואף עדיף שלא לשנותו. בוודאי כבר הבנתם שאינני מסכים עם קביעה זו ואני דוקא ממליץ לשנות את תוכן הפוסט לאחר מסגרת זמן מסויימת כדי שיתאים לצרכינו, כלומר - משיכת תנועה אורגנית ממנועי חיפוש (תוך שמירת הציביון המקורי של הפוסט כמובן).

לשם ההסבר, הבה נחלק את מסגרת הזמן האמורה לשניים:

1. מסגרת הזמן מפרסום פוסט חדש ועד לרגע לפני התפוגגותו מדף הבית.
2. מסגרת הזמן בה הפוסט כבר לא נמצא בעמוד הבית והגישה אליו נעשית מלינקים פנימיים או חיצוניים, הכוללים כמובן גם תוצאות רלוונטיות ממנועי החיפוש.כל עוד אנו נמצאים במסגרת הזמן הראשונה, מטרתינו היא למשוך את תשומת לב המשתמש ע”י שימוש בכותרת מעניינת ותוכן שכל מעודו ודרך כתיבתו הינה לעניין את המשתמש ואף להביא אותו לרישום לרסס ולהפיץ את הפוסט לחבריו באמצעות אתרי השיתוף, דואר אלקטרוני וכדומה. במסגרת זמן זו אין צורך לתת תשומת לב מיוחדת למנועי החיפוש, שכן האפקטיביות שלהם בטווח הקצר נמוכה מהאפקטיביות של דרכי ההפצה החברתיות.

אולם, משהגענו למסגרת הזמן השניה, האפקטיביות של דרכי ההפצה החברתיות יורדת באופן טבעי, שכן הדגש בהן הוא על תוכן חדש. מלבד זאת, הפוסט כבר לא נמצא בעמוד הבית ולכן אין לו משמעות בתפיסת עין המשתמש בעת סריקת האתר. במסגרת זמן זו, שבעצם לא תשתנה באופן דרסטי בעתיד (מלבד אולי “פיקים חברתיים” זמניים), מסת התנועה העיקרית לפוסט תהיה מלינקים פנימיים או חיצוניים וממנועי החיפוש. עובדה זו בעצם מובילה אותנו באופן טבעי למסקנה שעלינו להתאים עכשיו את תוכן הפוסט למנועי החיפוש. אבהיר ואומר כי כל מה שעלינו לעשות הוא לשנות מעט את התוכן (ומיד אסביר כיצד), ולא את המבנה עצמו, שכן רוב פלטפורמות הבלוגים נותנות בסיס איתן מבחינת אופטימיזציה מבנית, בייחוד אם משתמשים כהלכה בשלל הפלאגינים שתיארתי בעבר.

אז כיצד לשנות את התוכן?

מטרתינו העיקרית הינה לעשות שימוש במילות מפתח בהן נעשה שימוש רב ע”י המשתמשים, אולם, עליהן להיות גם ממוקדות דיין כדי למשוך תנועה איכותית. כדי למצוא מילים אלו, נשתמש בכלי של גוגל, עליו כבר הסברתי בעבר, כלי שעבור מילה מסויימת מציע מילים נרדפות ודומות מאותו תחום, בנוסף למידע יחסי על כמות החיפושים. כדי להבהיר את הנקודה הזו, ניקח לדוגמה בלוג העוסק בתחום הצילום, ונניח, לשם הדיון, שמדובר בפוסט אודות השימוש בעדשת זום, למשל: “כיצד לבחור עדשת זום”. כאמור, מטרתינו היא לשנות את הכותרת ולהשתמש במילים פופולריות.

הנה התהליך המלא:

1. היכנס לכלי הצעת המילים של גוגל.
2. בחר את השפה והמדינה המתאימה. במקרה שלנו ישראל ועברית.
3. רשום את המילה הרלוונטית העיקרת הנוגעת לפוסט. במקרה שלנו “עדשת זום”.
4. לאחר הלחיצה על Get Keywords Ideas, מיין על פי Avg Serach Volume.
5. עכשיו עלינו לחפש מילים בעלות משתמעות דומה או זהה תחת המילים המוצעות ע”י גוגל, אולם כאלו שכמות החיפושים עבורן רבה יותר מאשר עבור המילה המקורית. בדוגמה שלנו ניתן לראות כי כדאי לשלב בצורה כלשהי את המילה “עדשת מצלמה” גם כן, שכן כמות החיפושים הינה רבה. למשל: “המדריך המלא לעדשת המצלמה - כיצד לבחור עדשת זום”. ברגע שנעשה שינוי זה, כמו גם נשתמש במילה זו בתוכן עצמו - התנועה לפוסט תיגדל שכן יותר משתמשים מחפשים “עדשת מצלמה” ולכן קיים סיכוי גדול יותר להגדלת החשיפה.

כיצד אני מגדיל את התנועה ממנועי החיפוש לפוסטים ישנים

כמובן שהפעילות הנ”ל חייבת להתבצע במקביל לפעולות אופטימיזציה ובניית קישורים והמלצתי היא לשלב אותה באופן שוטף בפעילויות הקידום. אם שינוי של התוכן עצמו עלול לערוך זמן רב מידי, נסו לפחות לשנות את הכותרת ולשלב בה מילים פופולריות. התוצאות לא תאחרנה לבוא.

קריאה נוספת:

אופטימיזצית וורדפרס - טג הטייטל

אופטימיזצית וורדפרס - טגי ה - META

אופטימיזציית אתר - האלף בית

מציאה וניתוח של מילות מפתח בשוק הישראלי

נהנתם? שתפו את חבריכם:
  • טע.י.ם. לי
  • חפרן
  • HOTחדש
  • שווה קריאה
  • StumbleUpon
  • Technorati

מהם גוגל sitelinks ואיך גם לאתר שלי יהיו?

ראשון, 30 בדצמבר 2007

קישורי האתר (sitelinks) של גוגל הינם קישורים ישירים לעמודים פנימיים שמוצגים כחלק מתוצאות החיפוש בתוצאת החיפוש הראשונה, עבור אתרים מסויימים:
מהם גוגל sitelinks וכיצד אצור כאלה לאתר שלי?

הנה ההסבר של גוגל לגבי קישורי האתר, בתרגום חופשי (המקור כאן):

“הקישורים המוצגים מתחת לחלק מהאתרים בתוצאות החיפוש, הנקראים sitelinks, נועדו כדי לעזור למשמשים לנווט באתר. המערכת שלנו מנתחת את מבנה הקישורים של אתרך כדי למצוא קיצורי דרך שיחסכו למשתמשים זמן ויאפשרו למצוא במהירות את המידע אותו הם מחפשים.
אנו מראים קישורי אתר רק כאשר אנחנו חושבים שהם יהיו מועילים למשתמש. אם מבנה אתרך לא מאפשר לאלגוריתם שלנו למצוא קישורי אתר טובים, או אם איננו חושבים שקישורים אלו יעזרו למשתמש, אנו לא נציג אותם.
כרגע, קישורי האתר נוצרים באופן אוטומטי לחלוטין. אנו תמיד מנסים לשפר את האלגוריתם….”

אחרי ההסבר היבש הנ”ל מצד גוגל, ננסה לחפור קצת יותר לעומק ולהבין כיצד העסק עובד. ניתן בעצם לחלק את נושא קישורי האתרים לשתי שאלות עיקריות:

1. אילו אתרים “ראויים” להצגת קישורי אתר? במקרה זה אין לנו שליטה רבה ולא נוכל להכריח את גוגל להציג את האתר שלנו עם קישורי ניווט. מכיוון שקישורי הניווט מוצגים כדי לעזור למשתמש, כלומר כדי להקל על הניווט הישיר לעמודים ספציפיים, לא ניתן אלא להבין כי ההחלטה הזו אף נתקבלה ע”י ניתוח תנועת המשתמשים, כלומר, בראש ןבראשונה מדובר באתרים בעלי תנועה רבה המתקבלת מגוגל. ניתן לראות גם כי קישורי הניווט עצמם בגוגל מפנים לגוגל עצמו, שמצידו מבצע הפנייה לעמוד, תוך שמירת המידע לשם ניתוח. מה שמחזק עוד יותר תיאוריה זו הינה העובדה כי קישורי האתר מופיעים רק עבור תוצאות המוצגות ראשונות, עמור מילות חיפוש פופולריות.

2. במידה ואתר הינו “ראוי”, מה על בעל האתר לעשות כדי לוודא שאכן קישורי האתר יוצגו? כאן יש לבעל האתר מעט יותר שליטה ויש להקפיד על מספר דברים:

- מפת אתר - יש להרשם לגוגל וובמסטרס ולהעלות מפת אתר.
- יש לוודא כי האתר הינו קל לניווט - לא רק מנקודת מבט המשתמש אלא גם מנקודת המבט של המנועים.
- יש ליצור קישורים מכל עמוד פנימי לקישורי הניווט הרצויים.
- יש לתת שמות ברורים וישירים לקישורי הניווט, שמות בעלי מילה אחת עד שלוש.
- יש ליצור לינקים מאתרים חיצוניים לעמודים הפנימיים המייצגים את קישורי הניווט, מלבד קישורים לעמוד הבית.
- חשוב! גוגל יציג קישורי אתר אך ורק אם הוא מגלה ארבעה או יותר קישורים פוטנציאליים כאלה - יש לוודא כי הפעולות הנ”ל מבוצעות על מספר מספיק של קישורים.

ומה אם יש לאתר sitelinks אולם הם אינם נכונים? ניתן לחסום קישורים אלו דרך חשבון הגוגל וובמסטרס. לאחר הכניסה,  יש ללחוץ על Links -> Sitelinks ולחסום את הקישורים הבלתי רצויים.

נהנתם? שתפו את חבריכם:
  • טע.י.ם. לי
  • חפרן
  • HOTחדש
  • שווה קריאה
  • StumbleUpon
  • Technorati

כיצד להשתמש בתקצירי וורפרדס למניעת תוכן משוכפל וזירוז הטעינה

שני, 22 באוקטובר 2007

במרבית הבלוגים ניתן לראות כי הפוסטים מוצגים בעמוד הראשי באחד משני אופנים: פוסטים מלאים או פוסטים חלקיים, הכוללים קישור כגון “לחץ להמשך קריאה” לפוסט המלא. כברירת מחדל, וורדפרס מציגה פוסטים מלאים בעמוד הראשי, וניתן להציג פוסטים חלקיים באמצעות שימוש בטיזרים או בתקצירים:

תקצירי וורדפרס:
בעת כתיבת פוסט (או עריכתו), ישנו שדה שנקרא תקציר, ובו ניתן לרשום את תקציר הפוסט, או פשוט להעתיק את הפיסקה הראשונה. לאחר מכן, באמצעות פלאגינים שונים (פרטים בהמשך), ניתן להשתמש בתקצירים אלו בעמוד הראשי, כאשר בסופם יתווסף קישור לפוסט המלא. שדה התקציר הינו עורך טקסט רגיל ולכן רצוי להעתיק לשם את קוד ה - html עצמו.

תקצירי וורדפרס
טיזרים:
בעת כתיבת פוסט, ניתן להשתמש בטג “more” (הלחצן שמחלק את הפוסט לשניים בעורך הטקסט), לרשום את תחילת הפוסט לפניו (טיזר) ואת ההמשך אח”כ. וורדפרס תציג בעמוד הראשי רק את הטיזרים ותוסיף קישור לפוסט המלא.

טיזר וורדפרס

לפני שאפרט באיזו קומבינציה אני מעדיף להשתמש, אציין מספר חסרונות לשימוש בשני אופני תצוגה אלו:

חסרונות של הצגת פוסטים מלאים:
1. תוכן משוכפל - יצירת עוד מקור בו מופיע הטקסט כולו, בנוסף לעמוד הפוסט עצמו (ובמקרים מסויימים גם עמוד הקטגוריות ו/או הארכיון). גישתי לגבי תוכן משוכפל ידועה וניתן לקרוא עוד כאן וכאן.

2. במידה ומציגים מספר פוסטים בעמוד הראשי (ניתן לשלוט על כך דרך “אפשרויות -> קריאה”), נוצר נקניק ארוך של פוסטים שגם מקשה על סריקת העמוד (רוב המשתמשים “סורקים” עמוד בחיפוש אחר התוכן הרצוי, לא קוראים) וגם מאריך את זמן הטעינה, מה גם שמנועי החיפוש לא מעריכים תוכן רב מדי בכל עמוד.

3. במידה ונציג רק פוסט בודד או שניים בעמוד הראשי, אנו נקשה על המשתמש לסרוק פוסטים ישנים יותר.

חסרונות של הצגת פוסטים חלקיים:
1. אנו בעצם מכריחים את המשתמש לדפדף לעמודים םנימיים בבלוג ולא פורסים בפניו את התוכן העדכני במלואו.

2. מנועי החיפוש יזחלו קודם כל (בד”כ) בעמוד הראשי ואם כתבנו פוסט חדש - היינו מעוניינים שיאונדקס במלואו במהירות האפשרית.

הפתרון - שילוב של שני אופני תצוגה אלו:
מדוע לא להנות משני העולמות ולהציג למשתמשים את הפוסט או הפוסטים החדשים ביותר במלואם, ואת הישנים יותר באופן חלקי? כך נאפשר למשתמשים לקרוא את הפוסטים החדשים במלואם ולסרוק בקלות את הפוסטים הישנים יותר. ומה מבחינת מנועי החיפוש? ובכן, עמוד הבית יאונדקס קודם, ועד שיאונדקס עמוד הפוסט, אנו כבר נכתוב פוסט חדש שידחוק את הפוסט הישן לתצוגה חלקית, וכך נמנע מקרה של תוכן משוכפל כמעט לגמרי, מלבד אולי חלון זמן מוגבל.

הפתרון - מימוש:
ישנו פלאג פנטסטי שבאמצעותו ניתן להגדיר כי חלק מהפוסטים בעמוד הראשי יוצגו בצורה חלקית, ואף ניתן להגדיר האם על וורדפרס להשתמש בתקצירים שהגדרנו בעת הכתיבה, או (במידה ואין תקצירים ואנו מתעצלים לכתוב תקצירים) להשתמש ב - X מילים ראשונות של כל פוסט כתקציר. אחרי התקנת הפלאג, עירכו אותו (”תוספים -> עריכת תוספים”) ושנו את הטקסט של הקישור ל”המשך קריאה” בעברית.

נהנתם? שתפו את חבריכם:
  • טע.י.ם. לי
  • חפרן
  • HOTחדש
  • שווה קריאה
  • StumbleUpon
  • Technorati

כתובת ה - IP של אתרך והשפעתה עליו בתוצאות החיפוש

חמישי, 27 בספטמבר 2007

לכל משתמש שמחובר לרשת האינטרנט, בין אם מדובר באדם או באתר אינטרנט, יש מספר שמזהה אותו באופן ייחודי. מספר זה נקרא כתובת IP, והינו מורכב מארבעה רצפים של 3 ספרות, כאשר כל רצף מוגדר כ”קלאס” נפרדת: AAA.BBB.CCC.XXX. לקלאס C ישנה חשיבות מיוחדת, שכן אתרים שונים שלהם אותה קלאס C, בהכרח מקושרים בצורה כשלהי מבחינת הספק (ועל זה בהמשך).

כדי להקל על המשתמשים (הרבה יותר קל להקליד www.ynet.co.il מאשר 212.143.162.158 למשל), נוצר ה - DNS, כלומר השמת שמות לכל כתובת IP, כאשר התרגום של השם לכתובת נעשה ע”י שרתי DNS יעודיים. כאשר מוקלד שם אתר בשורת הכתובת בדפדפן, קודם כל מתבצעת פניה לשרת ה - DNS כדי לתרגם את השם לכתובת ה - IP ורק אז מתבצעת פניה ישירה לאתר באמצעות כתובת IP זאת. שרתי ה - DNS בנויים כעץ בעל ענפים ועלים רבים, כאשר עבור כל כתובת, קיים שרת “אב” אחד (או יותר, כגיבוי), בו מוגדר המיפוי בין הכתובת לשם. שרתי ה - DNS מפעילים מנגנון מטמון כדי למנוע פניה תמידית לשרת ה”אב” של כל כתובת בכל פניה, ושומרים כל כתובת בה הם נתקלים למשך זמן המוגדר מראש עבור אותה כתובת (TTL). שרתי ה - DNS מוגדרים במאפייני החיבור של מחשבך או מוקצים ע”י שרת ה - DHCP של הספק.

כתובת IP סטטית מול כתובת IP דינמית

כאשר אתה מתחבר באמצעות הספק לרשת האינטרנט, הספק מקצה לך כתובת IP שרירותית, מתוך מאגר ה - IP הקיים ברשותו. בד”כ, IP זה ישתנה בכל פעם שתבצע ניתוק וחיבור, ולכן נקרא IP דינמי. אתרים, לעומת זאת, בד”כ מקושרים לכתובת IP סטטית, גם כדי למנוע עדכון חוזר ונשנה של שרתי ה - DNS (ועדכון המטמון של העלים הרבים בעץ ה - DNS).

כתובת IP פרטית מול כתובת IP משותפת

כתובת IP פרטית מצביעה לאתר אחד בלבד. כתובת IP משותפת מצביעה למספר אתרים, כאשר השרת מציג את האתר המתאים ע”י בדיקת הכתובת שנרשמה בשורת הכתובת ו/או את כותרת ה - HTTP הרלוונטית. רוב האתרים הסטנדרטיים מקבלים כתובת IP משותפת, כאשר מספר האתרים שממופים לאותה כתובת IP יכול להגיע גם למאות רבות.

מיקום גיאוגרפי

מנועי החיפוש משתמשים בכתובת ה - IP כדי לזהות את מיקום השרת המארח את האתר. למיקום השרת ישנה משמעות רבה, שכן מנועי החיפוש יתנו עדיפות לאתר שממוקם בישראל כאשר נעשה חיפוש בגוגל ישראל, בחיפוש אחר דפים מישראל, מתוך הנחה שתוצאות לוקליות אלו יהיו רלוונטיות יותר עבור המשתמש. מלבד המיקום הגאוגרפי של השרת המארח, מנועי החיפוש נותנים עדיפות גם לסיומת הדומיים המקומית. כלומר, אתר בסיומת co.il יקבל עדיפות בתוצאות החיפוש הלוקליות.
לסיכום נושא זה, יש להקפיד על אחת האפשרויות הבאות (או שתיהן) כאשר מנסים לקדם אתר לוקאלי:
1. איחסון האתר אצל ספק מקומי.
ו.ו/או:
2. שימוש בסיומת לוקאלית.

ספאם

כאשר קיים קישור בין אתרים, מנועי החיפוש מודדים את רמת האובייקטיביות בין אותם אתרים. ככל שרמת האוביקטיביות עולה, כך הקישור מקבל ערך טוב יותר. ככל שהאובייקטיביות נמוכה יותר, רמת הקישור נמוכה יותר, עד לרמה בה הקישור מוגדר כספאם ועלול להביא לחסימת האתרים. האובייקטיביות נמדדת ע”י ניסיון למצוא קשר שאינו תמים בין האתרים, כגון החלפת לינקים, רשת של אתרים שיוצרים קישור בין אחד לשני, אתרים שרשומים על שם אותו גוף, אתרים שמוקצים על אותה קלאס C וכדומה. כדי להבין את ההגיון שמאחורי בדיקת קלאס C, נחזור לדוגה לרשת האתרים שהוקמה לשם קישורים הדדיים. סביר להניח שבמקרה כזה, הגוף המקים את רשת האתרים יבצע זאת אצל אותו הספק, ולכן יהי בעל אותה קלאס C. ניתן לקחת דוגמה זו אף רחוק יותר - יתכן שקיים לאתרך קישור תמים מאתר בעל נושא דומה, שבמקרה מאוחסן על אותה קלאס C שלך. רמת האובייקטיביות של קישור זה נמוכה באופן יחסי, ויותר מזאת - אם יהיו קישורים רבים כאלו (מקרה קיצוני, אבל יכול לקרות) - אתרך יכול להפגע באופן משמעותי בתוצאות חיפוש. קל לבדוק את האתרים המאוחסנים באותה קלאס C ע”י שרותים כגון whois.webhosting.info ו - www.dnsstuff.com.

לסיכום - בשוטף, אין כל סיבה להיבהל מהאמור לעיל, אולם יש לבחור את מקום האיחסון ואת הסיומת בתבונה, כמו גם לבדוק את האתרים המאוחסנים על אותה קלאס C כשלך במידה ויש צניחה בדרוג, צניחה שאינה מוסברת בצורה אחרת.

נהנתם? שתפו את חבריכם:
  • טע.י.ם. לי
  • חפרן
  • HOTחדש
  • שווה קריאה
  • StumbleUpon
  • Technorati