הודעות לעיתונות
הקמת איגוד חברות לטכנולוגיות שפת אנוש (NLP) בעברית ובערבית
-
תאריך פרסום
22.09.2020
תקציב התכנית לשלוש השנים הראשונות: כ-7.5 מיליון ₪
.jpg)
משרד הדיגיטל הלאומי בשיתוף רשות החדשנות, אישרו את הקמתו של איגוד חברות לטכנולוגיות שפת אנוש (NLP – Natural Language Processing), שיסייע בקידום הבנת השפה העברית והשפה הערבית במערכות ממוחשבות. בין החברות באיגוד: רפאל, Ginger Software, Melingo, AudioCodes ואחרות.
אשר ביטון, מנכ"ל משרד הדיגיטל הלאומי: "הסקטור הציבורי עוסק ביום יום במידע בעברית ובערבית שחלקו הגדול אינו מובנה. אחד מהאתגרים הגדולים בדיגיטציה של השירותים הציבוריים הינה לאפשר יעילות תפעולית, זמינה לציבור ללא עלות, לצד פריון גבוה".
אביב זאבי, סמנכ"ל תשתית טכנולוגית ברשות החדשנות: "האיגוד שהקמנו השבוע אמור לתת לתעשייה להוביל את הגדרות הצרכים ולסייע בסגירת פערים טכנולוגים שיאפשרו לעשות שימוש במאגרי מידע לא מובנים בעברית ולהוציא על בסיסם תובנות שישמשו מנוף למוצרים ושירותים לחברות ישראליות".
איגוד החברות לטכנולוגיות שפת אנוש (NLP), בו תשקיע רשות החדשנות כ-7.5 מיליון ₪ בשלוש השנים הקרובות, קם לאור איכות נמוכה ובלתי מספקת של זיהוי השפות עברית וערבית במערכות ממוחשבות מסוגים שונים בהשוואה לזיהוי הדיבור בשפות אחרות. הסיבה לאיכות הירודה והקושי בפיתוח טמונה בעובדה שעברית וערבית הינן שפות שמיות המאתגרות וקשות יותר לניתוח, וכך איכות ההבנה והזיהוי של שפת אנוש בעברית וערבית הינה נמוכה יותר ומהווה חסם ליישום ומימוש שירותים מתקדמים ואיכותיים.
מטרת האיגוד תהיה לייצר תשתית מו"פ שתאפשר בסיס אמפירי לא רק לזיהוי האלמנטים והדגמים המבניים המרכיבים את המערכת הלשונית, אלא גם למיפוי האופן שבו משתמשים במערכות האלו. אלו מאפיינים תחביריים, סמנטיים ומורפולוגים לצורכי מו"פ בתחום עיבוד שפה טבעית. על מנת לאפשר שיפורים מגוונים ורחבים ככל הניתן, הקורפוסים המתויגים בעברית ובערבית יהיו מתחומים מגוונים, בהם: חדשות, ארכיונים, סרטים, ספרים, מאמרים, שירות לקוחות, שידורי רדיו וטלוויזיה מתומללים ועוד ממגזרי תעשיה שונים.
נוסף על כך, יבחן האיגוד את האפשרות להתאמת כלי צד ג' (Open Source) ו/או יפותחו כלים בקוד פתוח לבדיקות ושיפור איכות הבנת השפות עברית וערבית ע"י מערכות מחשוב שונות. באמצעות תשתית זו, ניתן יהיה לשפר ולהגביר את איכות הפתרונות השונים לזיהוי שפת אנוש בשפות עברית וערבית. התשתית שיקים האיגוד תוקם על גבי ענן ותאפשר שיתוף מאובטח של הקורפוסים והרצת מערכת ניהול ואלגוריתמים לכל השותפים באיגוד.
קבוצת המשתמשים שתבצע שימוש בתוצרי הארגון תורכב הן מחברי האיגוד, המגיעים מתחומים שונים בתעשייה הישראלית, ואלו יבצעו שימוש בתשתית לצורך פיתוח שירותים, יישומים ותוכנות לשיפור שירות לקוחות, ניהול, ידע, קבלת החלטות ומימוש יישומים מתקדמים הדורשים הבנת שפה טבעית בעברית ובערבית.
בין החברות והמשתתפים בארגון נמצא חברות המפתחות פתרונות תשתית (מחקר ופיתוח בתחומי הבנת שפה וחברות המפתחות אלגוריתמים המשמשים אבני בניין ליישומים שונים בתחום); וכמובן חברות העוסקות בפיתוח שירותים ומוצרים בתחומי הבנת שפה. הצרכנים הפוטנציאליים למוצרים ושירותים מבוססי טכנולוגיות זיהוי שפה טבעית מגיעים ממגוון נרחב של מגזרים ושירותים: הייטק, בנקאות, ביטוח, תקשורת, בריאות, חינוך, תיירות, השמה, משרדים ממשלתיים, מערכות ביטחון ומודיעין ועוד.
רשימת החברות והגופים שחברים באיגוד:
תיאור הפעילות | שם החברה | 'מס |
AudioCodes Ltd היא ספקית של פתרונות קוליים מתקדמים ועיבוד מדיה עבור מקום העבודה הדיגיטלי | 1 | |
טכנולוגיות NLP | 2 | |
פתרונות מבוססות NLP (עיבוד שפה טבעית) עבור נותני שירותים וצרכים פנימיים | 3 | |
טכנולוגיות NLP | 4 | |
KD מתמחה בפיתוח תכנים לשוניים לשלל שפות, במקור מילונים לימודיים ורב-לשוניים, משתפת פעולה עם התעשייה ואקדמיה ברחבי העולם, ומשתתפת בפרויקטים של האיחוד האירופי (קונסורציומים במסגרת 2020H ורשתות מחקר במסגרת COST). | 5 | |
’ג'ינג'ר תוכנה’ vht חברת סטארט-אפ ישראלית שפיתחה טכנולוגיית שיפור שפות המשתמשת באלגוריתמים סטטיסטיים בשילוב NLP (עיבוד שפה טבעית), כדי לשפר תקשורת הכתובה. | 6 | |
פתרונות NLP (עיבוד שפה טבעית) לצרכים פנימיים | 7 | |
לינגו בע”מ, חברת בת של אנציקלופדיה בריטניקה, היא החברה המובילה בישראל במילוני רשת ובמוצרי חיפוש חכמים, והחברה המובילה בעולם בבלשנות חישובית בשפות שמיות. מלינגו מתמחה בפיתוח ושיווק של מוצרים ושירותים המבוססים על יישומי שפה טבעית, בשפות המסובכות ביותר מבחינת מחשוב – העברית והערבית, וכן מציעה החברה פתרונות ייחודיים בשפות שונות, בשווקים הפרטיים והמוסדיים. בין מוצרי החברה: מנועי חיפוש חכמים בעברית, ערבית ופרסית, פתרונות ייחודיים לאחזור מידע בסביבה ארגונית, מילונים מקוונים ומערכות להקראה אוטומטית של טקסט בעברית. המוצרים מיועדים לרשת האינטרנט, לרשתות אינטרה-נט פנימיות בארגונים, לרשתות טלפוניה ותקשורת סלולארית. מלינגו היא בעלת האתרים ‘מורפיקס’ – מילון עברי-אנגלי-עברי חינמי, ‘רב-מילים’ – המילון העברי המקיף ביותר ברשת, ‘נקדן מורפיקס’ – אתר לניקוד אוטומטי, ‘קולפיקס’- תוכנה להקראת טקסט, וכן מילונים דו-לשוניים בשפות נוספות. | 8 | |
פלטפורמה לפיתוח צ'אטבוטים | 9 | |
אונבגו (Onvego) עוזרת לדברים מסביבנו לדבר בשפתינו. חברות משתמשות בטכנולוגיה של אונבגו לעזור לבני אדם לתקשר באופן פשוט וטבעי עם מכונות ומכשירים באמצעות קולם. אנחנו מציעים שליטה ללא-ידיים וללא-מגע של מכשירי Industry 4.0 ו- IIoT | 10 | |
ב- Voca.ai נלהבים לעזור לחברות לספק לקוחות מרוצים, באמצעות שיחות דיבור טבעיות, אינטליגנטיות ואמפתיות, המועברות על ידי סוכני Voca המופעלים על ידי בונה מלאכותית (AI) -enabled EQ. אנחנו מחויבים ליצירת שיתופי פעולה WIN-WIN בין בני אדם ובינה מלאכותית, ובכך לשחרר סוכנים אנושיים להיות היצירתיים והטובים ביותר שהם יכולים, וכתוצאה לאפשר חווית לקוח (CX) נהדרת וחוויית עובדים (EX) נהדרת יחד. בעזרת אינטגרציה פשוטה ואלגוריתמים שעברו אופטימיזציה עצמית, ניתן ליישם את סוכני Voca במהירות הבזק, ללא המון נתונים ותהליכים מורכבים. | 11 | |
מתמחה בפיתוח תכנים לשוניים לשלל שפות, במקור מילונים לימודיים ורב-לשוניים, משתפת פעולה עם התעשייה ואקדמיה ברחבי העולם, ומשתתפת בפרויקטים של האיחוד האירופי (קונסורציומים במסגרת 2020H ורשתות מחקר במסגרת COST). | 12 | |
מנוע הבנת השפה (NLU) של אינטלקטום מערכות מיועד לניתוח טקסט או דיבור. המנוע מיועד לעבודה בעולם תוכן מוגדר (שיכול להיות רחב) – למשל הפעלה קולית של סימולציה, צ’אטבוט או חיפוש סמנטי בתחום מוגדר מראש בטקסט או בדיבור. | 13 | |
מנוע ההמלצות של חברת Argmax.ml מבוססת למידה ממוחשבת (ML) לפי מכונה. החברה יודעת להאריך את משך השהייה של הלקוח באתרים, ומגדילה את גודל סל הקניות הממוצע על ידי הצעת פריטים משמעותיים. | 14 | |
תמלול שנוצר על ידי בינה מלאכותית (AI). מכונת זיהוי דיבור אוטומטית מבוססת AI שלא רק יכלה לתמלל, אלא גם יכולה לתפוס כותרות תוכן שמע ווידאו בכדי לענות על צרכים אלה. | 15 |
ספקי תוכן לא מובנה:
• ארכיון הכנסת
• דיקטה
• הארץ
• גיקטיים (גיקמדיה)
• 150 בלוגים של כתיבה נשית
חוקרים מהאקדמיה:
• פרופסור רעות צרפתי, אוניברסיטת בר-אילן
• פרופסור אלון איתי, הטכניון
• פרופסור שולי וינטנר, אוניברסיטת חיפה
• אפי לוי, האוניברסיטה העברית
• שי פיין, המרכז הבינתחומי הרצליה
חברות או פרילנסרים המעוניינים לתרום לקורפוס השפה העברית יכולים לפנות במייל [email protected]