יום חמישי, 18 בפברואר 2010

חברות ישראליות בתעשיית השפה

כל תעשיה נבנית סביב צרכים שהיא מספקת. לדוגמא, תעשיית התקשורת מספקת ללקוחותיה העסקיים והפרטיים את הצורך לתקשר אחד עם השני באין ספור דרכים: תקשורת קווית, תקשורת אל-חוטית, אינטרנט מהיר וכו'. תעשיית השפה באה לספק צורך אפילו יותר בסיסי – לדעת ולהבין. מוצריה הבסיסיים הם חיפוש, תרגום ועיבוד מידע. בישראל פועלות עשרות חברות בתחום  כשכולן נלחמות על מקום קבע בתעשייה החדשה. 

חיפוש מידע

ענקי חיפוש כמו גוגל ויאהו שולטים בתחום החיפוש ביד רמה ומשאירים פירורים מבחינת נתח שוק לכל מי שמנסה להיכנס לתחום. בזירה הישראלית אפשר לציין את חברת Melingo ומנוע החיפוש שלה מורפיקס. החברה משווקת את מורפיקס כמנוע חיפוש חכם, בעל מודעות מורפולוגית, והמתקדם בעולם בשפות שמיות: עברית וערבית. עיקר הפעילות של החברה מתמקד בשיפור מנועי חיפוש ברשתות לוקליות והתאמתם לשפות בעלות מורפולוגיה עשירה, כגון עברית וערבית.  המודול של Melingo מקבל שאילתה לפני שנשלחה למנוע החיפוש, מנתח אותה מורפולוגית ומעצב אותה מחדש במטרה לשפר את תוצאות החיפוש. בין לקוחותיה של החברה  אפשר למצוא ענקית תוכנה Microsoft וחברות  גדולות נוספות. ל-Melingo יש גם יכולות תרגום מוגבלות, אך חינמיות (מורפיקס מילון): אלטרנטיבה נחמדה לבבילון, כשהוא אינו בהישג יד.

לחיפוש מקוון יש פן נוסף המתבטא בכל אותן אנציקלופדיות מקוונות שצצו להן ברשת. כשגוגל מציגה לגולשים רשימה ארוכה של אתרים הכוללים את הביטוי הרצוי (ובכך מתנהגת כחברת פרסום נטו), המטרה של אנציקלופדיות מקוונות היא אחרת. הן קודם כל מנסות להסביר את המושג ורק אז מפנות אותך לאתרים נוספים. אחת החברות הבכירות בתחום היא החברה הישראלית Answers Corporation. המוצר העיקרי של החברה הוא אתר Answers.com,  שבו גולשים מגדירים שאילתות מנוסחות כשאלות רגילות ומקבלים תשובות המבוססות על כ-250 מילונים ואנציקלופדיות (ReferenceAnswers). כמוכן גולשים יכולים לענות לשאלות של גולשים אחרים ובך להרחיב את בסיס הידע של החברה (WikiAnswers).

כרטיס ביקור: Answers Corporation
כתובת בישראל:
ת.ד. 48253
פארק תעשיה – המגדל
ירושלים, 91481
תיאור כללי:
החברה הוקמה ב-1999 תחת השם GuruNet
מעסיקה 89 עובדים בישראל וארה"ב
שפות: אנגלית, ספרדית, צרפתית, איטלקית, גרמנית וטגלוג (פיליפינית)
מצב פיננסי:
החברה נסחרת בנסד"ק (ANSW)
שווי שוק 60$ מיליון (16.02.2010) – הגיע ליותר מ-100$ מיליון בסוף 2009
הכנסות – כ-20$ מיליון בשנה,  רווח לאחר מס 1.76$ מיליון

עיבוד מידע

בתחום זה פועלות מספר חברות, כשכל אחת פונה לפלח שוק קצת שונה בהתאם לסוג המידע ומטרות העיבוד. לדוגמא, חברת IntoView פונה לשוק הביטחוני עם מוצרים כמו בדיקת בלוגים וזיהוי שמות פרטיים. חברת DigitalTrowel פונה למחלקות השיווק של לקוחות העסקיים עם פתרונות בתחום ניתוח מתחרים או ניתוח יחס (סנטימנט) למותג או מוצר. 

החברה הישראלית היותר מוכרת בתחום היא כמובן ClearForest, היום חלק ממחלקת השווקים של Thomson – Reuters. המוצר שלהם -  OpenCalais מיועד למו"לים, בלוגרים (כמוני!) ויצרני תוכן אחרים. OpenCalais מבצע ניתוח סמנטי של טקסט, מעשיר אותו בטגים סמנטיים (לחיפוש מבוסס על web 3.0) ומציע תמונות רלוונטיות מ- Flickr. למוצר יש הרבה יכולות נוספות, אך הדברים האלו צדו את עיניי בתור בלוגר.

כרטיס ביקור: ClearForest
כתובת בישראל:
דרך אם המושבות 94
ת.ד. 3673, קריית אריה
בניין אורן, פ"ת, 49527
כללי:
החברה הוקמה ב-1998, נרכשה ע"י רויטרס ב-2007
מעסיקה כ-60 עובדים

שיווק חכם ומקוון

בשנים האחרונות סוף-סוף זכינו לראות את עלייתו של הפרסום באינטרנט על חשבון טלוויזיה וסוגי מדיה אחרים. יעילותו של פרסום תלויה מאוד בהתאמת פרסומת לקהל יעד נכון בזמן נכון. גדולתה של גוגל שהיא משווקת חכות לאוהבי דייג בדיוק כשהם מחפשים אותן ברשת. עיבוד שפות טבעיות מאפשר למפרסמים לעשות קפיצת מדרגה נוספת בזיהוי לקוח פוטנציאלי. לפחות שתי חברות ישראליות מפתחות טכנולוגיות בתחום זה. חברת Peer39 מפתחת פלטפורמה לניהול פרסומות, אשר מנתחת את התוכן וסנטימנט של העמוד ובוחרת פרסומת המתאימה ביותר.  המוצר פונה למו"לים ולמנהלי מותגים. חברה נוספת (ואף מוכרת יותר) Kontera Technologies עושה אף יותר מזה. היא יודעת להצמיד פרסומת מתאימה למילה או ביטוי רלוונטי בטקסט. לא סתם המו"לים והמפרסמים הגדולים בעולם משתמשים בטכנולוגיה של החברה.

כרטיס ביקור: Kontera Technologies
כתובת בישראל:
רח' אבא-אבן 8
בניין B, קומה ראשונה
הרצליה פיתוח, 46725
כללי:
הוקמה ב-2003, פועלת בעיקר בארה"ב
מעסיקה ?? עובדים (מי שיודע, אנא ספרו לי)
מצב פיננסי:
גייסה כ-15.5$ מיליון דולר
משקיעים:
Sequoya Capitals
Carmel Ventures
Tenaya Capital

כתיבה נכונה

כל מי שעבד בסביבה בינלאומית ונאלץ לעבוד עם לקוח מחוץ לארץ יודע עד כמה התקשורת איתו יכולה להיות קשה – הבדלים תרבותיים ופסיכולוגיים ומעל הכול אנגלית הרחוקה מלהיות מושלמת (בד"כ משני הצדדים). תוכנה שיודעת לתקן שגיאות כתיב ודקדוק ואף לבחור במילה נרדפת המתאימה יותר, אולי לא תפתור את כל הבעיות, אך יכולה לעזור במיוחד בתקשורת בין ארגונית ותקשורת עם לקוחות.

שתי חברות ישראליות מציעות מוצרים בתחום זה. חברת WhiteSmoke פונה בעיקר לשוק העסקי עם מוצרים המותאמים לסגנונות כתיבה שונים: עסקי, ניהולי, כללי, יצירתי וכו'. חברת Ginger Software מציע פתרון דומה למוסדות חינוכיים ולאנשים לוקים בדיסלקסיה.

תרגום

לא אסיים לפני שאגיד כמה מילים על תרגום. תחום התרגום הלא מקוון נשלט ע"י חברות תרגום ענקיות המעסיקות אלפי מתרגמים. לאחרונה, הן התחילו לפזול לעבר תוכנות לתרגום אוטומטי וחלקן אף משלבים שרתים של SysTran או LanguageWeaver בתור כלי עזר למתרגמים. אני מעריך שהמגמה הזאת תמשיך וחברות תרגום ישמשו זרז להתפתחות של התרגום האוטומטי.

החברה הבולטת ביותר בתחום התרגום בישראל היא בבילון. בבילון הידוע בעיקר בזכות המילונים שלה (75 שפות!) המשלבים טכנולוגיית ה-OCR. החברה השיקה מערכת לתרגום אוטומטי מקוון, אך לא רשמה הצלחה רבה .

כרטיס ביקור: בבילון בע"מ
כתובת בישראל:
רח' התעשיה 10
אור-יהודה, 60212
כללי:
נוסדה ב-1997
מעסיקה ?? עובדים
מצב פיננסי:
נסחרת בבורסת ת"א
שווי השוק: 277,562 אלפי שקלים (כ-74$ מיליון)
סך הכנסות ב-2009 (עד ספטמבר): 62,711 אלפי שקלים (כ-16$ מיליון)
רווח נקי ב-2009 (עד ספטמבר): 16,900 אלפי שקלים (כ-4.5$ מיליון)

8 תגובות:

  1. לגבי Digital Trowel (לא trowler):
    Trowel זה כף בנאים, שמשמשת גם לחפירה, שם הגיוני כשמדובר בחברת text mining.

    השבמחק
  2. טעות שלי, אני אתקן את הקטע הזה בבלוג

    השבמחק
  3. כעובד Answers Corporation, התיאור שלך מדויק, פרט לטעות אחת: ל-Answers Corporation היה ב-2009 רווח תפעולי של 4.9 מיליון דולר.

    השבמחק
  4. צודק, התכוונתי לרווח לאחר מס

    השבמחק
  5. שכחת בסקירה שלך עוד תחום אחד של שימוש בשפה טבעית -
    והוא - ניתוח הטקסט לטובת החזרת מידע או ביצוע פעולה -
    פרוייקטים בולטים בתחום הם מערכת המידע של אגד בה ניתן לשאלו שאלות כגון "מתי יוצא האוטובוס האחרון מחר מתא לק. שמונה" ולקבל תשובה מדויקת, או שירות ההקלטה של YES המאפשר למשתמש לכתוב בקשה כגון: "תקליט לי לונדון את קירשנבאום היום בערב" והמערכת תקליט את התוכנית הרצויה.

    קרן דובקובסקי
    (מנהלת פרוייקטים)

    השבמחק
  6. אשמח להוסיף את התחום לפוסט. האם תוכלי לספק קצת יותר מידע עליו? דו"אל שלי: glembers@campus.haifa.ac.il

    השבמחק
  7. אני מתנצל מראש על הקטנוניות, אבל הרווח לאחר מס של Answers Corporation בשנת 2009 היה 1.76 מיליון דולר, ולא כפי שכתבת.

    השבמחק
  8. האמת היא שלא מצאתי אף מסמך רשמי שמסכם את השנה והתבוססתי על התוצאות של שלושה רבעונים ראשונים.
    האם תוכל להפנות אותי לתוצאות רשמיות של 2009?
    בכל מקרה, אני אתקן.

    השבמחק