ניו-טק מגזין | פברואר 2020 | מהדורה דיגיטלית
IoT מוסף מיוחד
כנולוגיות קול ודיבור נמצאות עמנו שנה. למרבה הצער, 30- כבר למעלה מ כוח הענן, שיפר את הדיוק בזיהוי הדיבור, WER הנמדד בשיעור המילים השגויות (- .95% - ), והינו כיום למעלה כ word error rate אנליסטים סבורים כי רמת דיוק כזו תשנה את כללי המשחק. היא תאפשר פיתוח מוצרים אמינים לתעשייה ולצרכן הפרטי, ששיעור האימוץ שלהם יהיה גבוה. זוהי הסיבה מדוע כיום אנו רואים ועושים שימוש ביישומי קול המשולבים בפלטפורמות פופלאריות רבות. הופעת טכנולוגיות בינה מלאכותית מבוססות ענן פתחה אופק חדש ליישומי קול - עיבוד דיבור ושפה. כעת, כשאנו נהנים מדיבור המתומלל בצורה מדויקת לטקסט, הצעד הבא הוא להבין את הסמנטיקה של השפה ובעקבות זאת, את הכוונה של הדובר. זוהי משימה המתאימה במיוחד לבינה מלאכותית. היא ) והבנה NLP נקראת עיבוד של שפה טבעית ( ). באמצעות יכולות NLU של שפה טבעית ( אלה, הקול משנה צורה והופך ל"קול חכם". על מנת ליישם הבנה טבעית של השפה, מנצלת הטכנולוגיה בצורה אינטנסיבית למידה חישובית. מדובר בעוד חלק בטכנולוגיות הקול החכם הצורך כוח מחשוב רב, ומשאבי זכרון גדולים הזמינים שניהם בצורה נרחבת בסביבת ענן. מרכיב מרכזי בטכנולוגיות הקול החכם הינו Terra Venture Partners , חברת פורטפוליו של קרן Onvego מרק חפץ, סמנכ"ל ומייסד שיעור האימוץ שלהם בקרב צרכני יכולות הדיבורבייחוד בתעשייה, היה תמיד נמוך. הסיבה לכך היא שמנועי זיהוי הדיבור השונים סבלו מחוסר אמינות ורמת דיוק נמוכה, אשר הפכו אותם ללא שימושיים. טכנולוגיית הקול העיקרית – זיהוי דיבור אוטומטי ), משמשת לתמלול קול לטקסט. מדובר ASR ( בטכנולוגיה עתירת מחשוב הדורשת כוח חישוב גדול ומשאבי זכרון לא מבוטלים על מנת לספק תוצאות טובות. החדשות הטובות הן שטכנולוגיה זו ביצעה זינוק ענק קדימה בשנים האחרונות. זאת, הודות להתפתחות מהפכנית בתחום ) והלמידה החישובית AI הבינה מלאכותית ( ). טכנולוגיות Machine Learning - ML ( בינה מלאכותית מצידן, חבות את הצלחתן והתפשטותן המהירה לגידול בכוח החישובי שקיבלו מטכנולוגיית הענן. באמצעות כוח חישוב זה, כל רשתות המחשוב ה"עצביות" ,) Deep Neural Networks ( DNN כגון ) ואחרות Recurrent Neural Networks ( RNN הנמצאות בבסיס טכנולוגיות הדיבור, הפכו לאפקטיביות ביותר ומספקות תוצאות טובות בהרבה. ט כשטכנולוגיותקול ובינהמלאכותית יורדיםמהענן אל מכשירי הקצה יכולת השיחה. במקרה שבפתרון או במוצר (מכשיר חכם או רכב חכם), המוח המלאכותי יכול להבין את הדיבור של המשתמש, יהיה אך טבעי עבורו גם להגיב למשתמש בדיבור מצידו ולאפשר חווית שיחה ורמת שיחה המקבחלה לממשק האנושי. זהו המקום בו משתלבת ) כחלק משיחה DM טכנולוגיית ניהול דיאלוג ( Onvego מבוססת בינה מלאכותית. חברת פיתחה פלטפורמת פיתוח ליישומים מבוססי DM דיבור הכוללת את כל המודולים הנ"ל (, ) בכלי פיתוח אחד. NLU , ASR על פניו הדבר נראה כמו הפתרון האידיאלי המאפשר לטכנולוגיות לחיות יחדיו בשיתוף פעולה מושלם אולם יש גם מספר חסרונות לעבודה בענן. ראשית, כל כוח מחשוב מבוסס ענן עולה כסף. שנית, צריכת החשמל הגדולה של חוות שרתי ענן הפכה אותם למפעלים אמיתיים בתעשייה הדיגיטלית, הנזקקים לטכנולוגיות קירור זוללות אנרגיה. בנוסף, קיימת השהיה ברורה בתקשורת בהעברת מידע מיישומים ומכשירים מקומיים לענן, וחזרה. במקרים רבים, השהיה זו קריטית עבור יישומי זמן אמת. חסרון מהותי נוסף של הענן נוגע לאבטחת המידע ובטיחות המידע המועבר לענן לעיבוד. ביישומי קול ושפה במיוחד, הפכו ענייני
New-Tech Magazine l 46
Made with FlippingBook - Online catalogs