בלוג

עדכון ברט: מהו ואיך הוא עומד להשפיע על דפי התוצאות בגוגל?

בחודשים האחרונים הרשת גועשת סביב העדכון החדש של גוגל שזכה לשם “ברט” או BERT – ראשי תיבות שנועדו להסביר את משמעותו, אך במקום זאת גרמו לבלבול בתעשייה. במאמר זה ננסה להבין איך ישפיע BERT על תוצאות החיפוש. האם אתם צריכים לשנות דבר מה בתכני האתר? ומה ניתן להסיק מהשינוי באלגוריתם על עתיד החיפוש בגוגל?

לאחרונה, גוגל השיקה את האלגוריתם העדכני ביותר שלה, שהוכרז כשינוי החשוב ביותר בחמש השנים האחרונות. עדכון זה ישפיע על כ-10% מדפי התוצאות שיוצגו בפני הגולשים בהתאם לשאילתות החיפוש.

מה נשתנה באלגוריתם הזה מכל האלגוריתמים?

השינוי החדש באלגוריתם נועד לזהות את כוונת הגולש בהקישו ביטוי זנב ארוך בהתאם למילות הקישור המופיעות בשאלה וכן המיקום של כל אחת מהמילים בשאלה זו. הדרך הטובה ביותר להמחיש את השינוי היא באמצעות דוגמה:

נניח שגולש מקיש את השאלה הארוכה “מה ההבדל בין חוקי פינוי דייר בישראל לחוקים באמריקה”?

לפני עדכון ברט, האלגוריתם של גוגל מפרק את השאלה למילים “ישראל” “אמריקה” “דייר” “פינוי” “הבדל” ומחפש תוצאות שמכילות את המילים הללו מבלי “להבין” את משמעות השאלה ומה בעצם הגולש רוצה לדעת?

התוצאות שמופיעות כיום, לפניי שהעדכון “גויר” לשפה העברית הן: חוקי הגנת הדייר בכנסת, חוקת ארצות הברית, יחסי גומלין בין משפט למוסר ונושאים נוספים. כלומר, גוגל מבין שאנחנו מחפשים חוקים בישראל וחוקים באמריקה ונושאים שקשורים לזכויות הדייר. אך, הוא עדיין לא מסוגל לעשות את ההקשר הממשי של חיפוש מאמרים המשווים בין אמריקה לישראל בתחום חוקי פינוי הדיירים.

לאחר ש – BERT ישפיע על הבנת השאלה של הגולש התוצאות שיראו בדף הראשון יתאימו לתשובות הנכונות לשאלה, דהיינו יעסקו בהבדלים בין חוקי פינוי הדיירים בארה”ב מול החוקים הקיימים בארץ.

איך גוגל מסבירים את השינוי הגדול ב – BERT?

לפי גוגל השינוי ישפיע על שאילתות מורכבות וחיפושים שעד כה מנוע החיפוש “התקשה להבין”. לדבריהם, “השיפורים מיועדים לשפר את יכולת הבנת השפה, במיוחד בחיפושים שבהם יש שימוש בשפה טבעית/שפה יומיומית המשמשת לדיבור”. זאת משום ש – BERT מסוגל להבין את ההקשר שבו הוקשו המילים ולהתאים טוב יותר את תוצאות החיפוש לשאלות שנשאלו.

השינוי ישפיע במיוחד על שאילתות ארוכות, או חיפושים שבהם מילות קישור או אותיות קישור כמו: “ל” או “בשביל” אקוטיות להבנת המשמעות. כעת, מנוע החיפוש יוכל להבין את ההקשר בצורה שתאפשר לבצע כל חיפוש בשפה טבעית יותר”.

הדרך בה נבנה האלגוריתם באמצעות “למידה עמוקה”

מי שמתעניין קצת יותר לעומק בדרך בה נבנה האלגוריתם, יכיר בוודאי את התחום המרתק בעולם התכנות המכונה “Deep Learning” או “למידה עמוקה”. בדומה למוח האנושי השומע מילים ומסוגל להבין את ההקשר בה נאמרו, ניתן לבנות תוכנה המסוגלת לזהות לאט את ההתאמה של אותן מילים למשמעות הנכונה בהתאם לתוכן הנאמר סביבן.

כאשר אתם שומעים, למשל, עמית לעבודה מדבר על “עכבר” תוכלו להבין אם מדובר בחיה ארוכת הזנב או בעכבר הפלסטיק המחובר למחשב מתוך ההקשר של שאר המלים במשפטים שאמר. באותה מדיה, מתכנתים המוסיפים לתוכנה אפשרות תיעוד של ההקשרים השונים וזיהוי של מילים נוספות או תחומי עניין הקשורים לעכבר, ידעו להבין מה חיפש המשתמש? כך, אם תחפשו היום בגוגל עכבר למחשב ותקישו רק את המילים עכבר למק, גוגל ידע לזהות כי אין מדובר בעכבר חי. בשאילתות מורכבות יותר כמו: איך אפשר לתפוס עכבר מבלי להרוג אותו? גוגל ידע לזהות כי אתם מחפשים פתרונות ללכידה עצמאית במקום פניה ללוכד עכברים מקצועי.

הלמידה הזו מתבצעת באמצעות ניתוח החיפושים הקודמים של הגולשים, ובחינת הצלחת תוצאות החיפוש לספק את התשובה לשאילתה המבוקשת. זיהוי ההקשרים בין השאלות לתשובות הנכונות, יאפשר לאלגוריתם להתפתח ולהשתפר.

איך ישפיע ברט על תחום קידום האתרים?

במרבית המאמרים שנכתבו בנושא התקשו מומחי הקידום לזהות כיצד יצליח העדכון החדש להשפיע על פעולת הקידום עצמה? אחד מהבלוגרים הרים את הכפפה בכל זאת ושאל את מומחית הקידום – דון אנדרסון “האם נדרש שינוי כלשהו בדרך בה האתרים נכתבים ובנויים לאור העדכון החדש”? לדבריה – “תכנון התוכן באתר יצטרך להיות הרבה יותר מובנה…” גם היום, מומחי לשון יכולים להתווכח מה התפקיד של כל מילה במשפט מורכב? קל וחומר גולשים אשר קוראים את התוכן באתר ולא תמיד מבינים את הנקודות השונות אותן ניסה להמחיש הכותב. נראה כי תהיה עבודה רבה עבור הכותבים בתכנון מבני של המשפטים באתר. כמו כן, אתרי מכירות רבים המבוססים על כמות גדולה של תמונות ותוכן דל, יצטרכו להתחיל להוסיף הקשר לתוכן, בין השאר באמצעות לינקים פנימיים בתוך האתר”.

האם הכיוון של כתיבת האתרים צריך להתבסס על ביטוי זנב ארוך מעכשיו?

אחד החששות העיקריים של המקדמים כאשר גוגל הכריזה על BERT, עוד לפני שהוא הוטמע בפועל במנועי החיפוש, הוא – הצורך להתחיל להתכונן לכמות גדולה של ביטוי זנב ארוך שישתלבו בתוכן עצמו.

בפועל, BERT הוכיח את עצמו כחכם הרבה יותר. למשל – חיפושים באנגלית של ביטוי הקשורים לדגים המכונים: “Cow Stripe” באמצעות החיפוש How to catch a cow fishing? “” הניבו תוצאות הקשורות לבקר ולא לדגים לפני העדכון. לאחרי שיצא העדכון, מרבית התוצאות בעמוד הראשון אכן זיהו שמדובר בדג ולא בפרה מלחכת עשב.

אתרים שניסו להתבסס על פרסום הביטוי והוסיפו את השאלה “How to catch a cow fishing?” לא הצליחו עדיין להתברג בעמוד הראשון, השני והשלישי למרות ההתאמה המושלמת לביטוי זנב ארוך. גוגל למד לזהות את ההקשר בו נכתב התוכן ולנסות לתת את התוצאות הטובות ביותר שיתאימו לגולש ולא למקדם.

מה אפשר ללמוד מהשינוי החדש?

אם כך, התמקדות רק בביטוי זנב ארוך לא תעבוד. ככל שעוברות השנים והאלגוריתם של גוגל מתחיל להיות מתוחכם יותר, נראה כי בעלי האתרים צריכים להתכוונן לתוכן איכותי העונה על הצרכים של הגולשים ופחות של מנוע החיפוש.

מאז שעברו הימים בהם חזרה מונוטונית על ביטוי החיפוש סייעה לעלות מעלה בעמוד התוצאות, אנו רואים כיוון שונה לחלוטין. אתרים שבהם יש חזרה של יותר משני אחוז על ביטוי מסוים עשויים למצוא עצמם דווקא בסוף רשימת התוצאות. הכיוון עכשיו, הוא להעניק כמה שיותר ביטויים המציגים למנוע החיפוש את התוכן שבו האתר נכתב.

למשל – באתרים המקדמים שואבי אבק, גוגל ירצה למצוא תוכן העוסק ב: ניקיון, שטיחים, פילטרים מתאימים ואפילו בצורך של המנקים במכשיר עוצמתי יותר. מילים נרדפות יתחילו לקבל משמעות רבה יותר בתוך התוכן, כמו גם נתונים סטטיסטיים חשובים שיכולים לעניין את הגולש.

לסיכום, מאמרי הקידום של שנת 2020 יהיו הרבה יותר מרתקים, ידברו על אותו הנושא מזוויות שונות ויאפשרו לא רק לגוגל ליהנות מהתוכן הנכתב אלא גם לקוראים האנושיים. התאמת התוכן לשאלות והתשובות ופירוט רב על התחום בו נשאלה השאלה, יהיו המגנט האמיתי של מנועי החיפוש לאתר שלכם.