חיפוש בזמן אמת – כיצד בנוי האלגוריתם

תוכן העניינים 

1. מבוא
2. חיפוש בזמן אמת
3. האלגוריתמים
4. חיפוש לפי אזור
5. מסקנות וסיכום דברים

חיפוש בזמן אמת

כאן אנו מביטים על השקופית שהוצגה באירוע עצמו. הוספנו את התרגום בעברית מתחת לכל גורם בשקופית לנוחיותכם.

האלגוריתמים המאפשרים את החיפוש בזמן אמת

 

אמית סינגל, ממובילי טכנולוגיית החיפוש בגוגל, ציין שהיה עליהם לפתח עוד 12 אלגוריתמים חדשים כדי לאפשר את החישובים ליצירת חיפוש טוב בזמן אמת. בשקופית שהוצגה מצוינים רק עשרה מהם. בואו נבחן כל אחת מהן בהגדרה קצרה, ונוסיף כיצד היא משפיעה על תוצאות החיפוש ומשם כמובן על האופן שבו יפעלו חברות קידום אתרים בהמשך.

מודל שפה – מאריסה מאייר, ציינה שוב ושוב שגוגל עושה הכול בכדי לנתץ את מחסומי השפה הקיימים באינטרנט ובעולם בכלל. זה אומר שאם אנשים שונים ברחבי העולם ידברו על אותו נושא בשפות שונות, גוגל ידע להבחין באותו "גל" או "תנודות מידע" כפי שמתואר כאן ולהבין למעשה שכולם מדברים על אותו דבר.

כלומר, אם משהו קורה ברמה עולמית או יבשתית או בינלאומית, גוגל יבחין בו ברמת התפיסה הכוללת מבעד למחסומי השפה.

איכות טוויט (Tweet מלשון טוויטר) – טכנולוגיה חדשה שמאפשרת לגוגל לקבוע אם קריאה מסוימת בטוויטר (טוויט) היא קריאה איכותית, על פי איכות היוזר, כמות הre-tweets לקריאה מסוימת, זיהוי אם מדובר ברובוט אוטומטי או לא. בשילוב אלגוריתם נוסף שפיתחה מחלקת הספאם של גוגל שיודע להבחין מתי מדובר בBot (רובוט אוטומטי בטוויטר שיוצר את הקריאות)

איכות הכותב – לא היה פירוט באירוע על האלגוריתם הזה, אבל צוין שכל הטכנולוגיות הללו פותחו למעשה מתוך הקיים כיום. לכולנו מובן שמקורות תוכן איכותיים, זמינים ועדכניים אשר מקבלים קישורים והצבעות ממקורות אמינים איכותיים אחרים ונחשבים יזכו לדירוג טוב בתור "כותב איכותי" שיהיה ראוי דיו בכדי להיכלל בתוצאות אלו.

הסתברות רלוונטיות – בגלל המהירות שבה המידע מתנקז לגוגל, לפי תנודות המידע ברשת עבור חיפוש מסוים, הן מבחינת הגולשים והן מבחינת האתרים שמייצרים תוכן גוגל יכול להסיק בדיוק מאוד גבוה את רלוונטיות התוצאה להצגה מול שאילתות מסוימות, וכך לא תהיה הצגה עקרה של טוויטים , פוסטים בבלוגים או ידיעות שרק מכילות מילת מפתח מסוימת. אלא ממש המידע הרלוונטי ביותר עבור שאילתה מסוימת, בזמן מסוים במיקום מסוים.

סמנטיקה – את החשיבות של סמנטיקה כולנו מכירים, מינוחים שונים לאותה מילה יכולים להתכוון לתחום אחר לגמרי, ככל הנראה שיפור של היכולת של המנוע שוב להסתכל לפי התנודות ברשת ולהתאים את הסמנטיקה לרמה מדויקת יותר.

שליפת תוצאות בזמן אמת – נדרשת מהירות מאוד גבוהה על מנת לשלוף בזמן אמת תוצאות מתוך הרשת לנתח אותן ולהציג אותן על המסך (זה די מטורף שחושבים על זה) כלומר חייבת להיות יכולת להתחבר מאוד מהר למקורות באינטרנט ולהסיק מהם את המידע.

רישום השאילתה – לא ניתנה התייחסות ספציפית במהלך האירוע או במהלך השאלות בסוף לגבי סעיף זה.

רמת העכשוויות (Hotness) – מה קורה ברגע זה ממש בהקשר לשאילתה מסוימת, עד כמה זה "חם" הן מצד המחפשים, והן מהצד השני של עדכוני התוכן ברשת.

רמת תנודות התוכן – זה בעיניי אחד מהאלגוריתמים המעניינים. האלגוריתם מסוגל ברמת שניות לנתח דיבורים ברשת ולפי הדיבורים ברשת להבין מה קורה, איפה זה קורה, מאיזה מיקומים גיאוגרפיים מדברים על זה הכי הרבה, באיזה אתרים ובאיזה קצב כל התנודות מתרחשות. והכול בזמן אמת !

 

<< לקטע הקודם לקטע הבא >>