Car-tech

Systems Recognition Systems Must Get Smarter ، أستاذ > الأكاديمية يوضح الاتجاه الذي ينبغي أن تتجه أنظمة معالجة اللغة الطبيعية

إكتشف 10 خطوات فعالة لاكتساب لباقة الكلام

إكتشف 10 خطوات فعالة لاكتساب لباقة الكلام
Anonim

يمكن لمعظم أنظمة التعرف على الكلام المحوسبة فهم ما يقوله الإنسان حتى 98 بالمائة من الوقت ، ومع ذلك ، لا يزال الناس يشعرون بالضيق عند استخدام أنظمة مكتب المساعدة الهاتفية التلقائية. إن المفتاح لجعل هذه الأنظمة أقل إحباطاً لاستخدامها سيكون من خلال منحهم فهمًا أعمق للغة وجعلها أكثر تفاعلية ، كما قال ألين.

[اقرأ المزيد: يحتاج جهاز الكمبيوتر الجديد إلى هذه البرامج المجانية الممتازة الـ 15]

حتى الآن ، تقدم أقسام خدمة العملاء في معظم المؤسسات الكبيرة أنظمة مساعدة تلقائية تعتمد على الهاتف. يستدعي المستخدم رقم المساعدة ويطلب صوت اصطناعي من المتصل سلسلة من الأسئلة. تعتمد معظم هذه الأنظمة على أطر هي في الأساس أشجار قرار كبيرة. مع هذه الأنظمة ، "أنت لا تعرف ما يريده الشخص ، أنت تتبع نصًا" ، قال.

إن الأنظمة في الواقع هي مركب من عدد من التقنيات المختلفة. واحد هو التعرف على الكلام ، أو القدرة على فهم الكمبيوتر ، أو الترجمة بنجاح إلى نص ، ما يقوله المتحدث.

التقنية الأخرى ، معالجة اللغات الطبيعية (NLP) ، يحاول إما تحويل رسالة المتحدث إلى أمر يمكن تنفيذ الكمبيوتر ، أو التي يمكن تلخيصها لمشغل بشري.

تم إجراء خطوات كبيرة في كل من التعرف على الصوت والبرمجة اللغوية العصبية على مدى العقود القليلة الماضية ، ولكن يبدو أنها جلبت في الغالب الإحباط لمستخدميها. "أقوم فقط بالاتصال بالبنك عندما يكون لدي مشكلة ومعركة هذه الأنظمة. [أسأل] ما يمكنني الإجابة عليه للوصول إلى شخص في أسرع وقت ممكن" ، قال ألين.

كان العمل البحثي الأكاديمي لشركة Allen في إيجاد طرق "يمكننا أن نتحدث إلى آلة بنفس الطريقة التي يمكننا التحدث بها إلى شخص ما."

يمكن أن تكون المحادثات بين شخصين دقيقة في الطرق التي تجد صعوبة في مطابقة أجهزة الكمبيوتر. أشار ألين إلى بعض الأعمال المبكرة التي قام بها كطالب دراسات عليا ، حيث سجل المحادثات في مكتب معلومات محطة القطار. في أحد التفاعلات ، يمشي راكب إلى الكشك ويقول "8:50 إلى وندسور" ، والإجابات المصاحبة "بوابة 10 ، 20 دقيقة متأخرة." في حين أن الحاضنة كانت تعرف بالضبط ما هي المعلومات التي طلبها الباحث ، فإن الأنظمة المحوسبة ستعثر على العبارة الأولى للركاب تزعج.

الطريقة التي يراها آلن ، هناك عنصران مفقودان من الأنظمة الحديثة: القدرة على تحليل ما يقوله المتحدث و القدرة على التحدث مع المتحدث لمعرفة المزيد حول ما يعتزم المتحدث أن يقوله.

"الكثير من البرامج اللغوية العصبية الجاهزة تميل إلى أن تكون ضحلة. ليس لدينا تكنولوجيا تعطيك معنى للجمل". هو قال. يمكن لأدوات المعالجة الإحصائية وخدمة تعريف الكلمة مثل WordNet أن تساعد في تحديد كلمة ولكن أيضًا على علاقة الكلمة ، لذلك سيعرف النظام أن "الشركة الفرعية" ، على سبيل المثال ، جزء من "شركة".

المزيد هناك حاجة أيضا الاتصالات ثنائية الاتجاه بين المستخدمين وأجهزة الكمبيوتر. عند التحدث عن احتياجاتهم ، قد يقدم الناس المعلومات دون ترتيب معين. يجب أن يعود الأمر إلى الكمبيوتر ليجمع هذه المعلومات معًا ولا يثقل كاهل المستخدم بالأسئلة التي تم تقديم إجاباتها بالفعل.

"هذا هو المستقبل ، هذا ما تريده الأنظمة حقًا ، ويمكننا إنشاء حوار وقال: "لتوضيح هذه الفكرة ، قام ألين وفريق من الباحثين بتصميم برنامج يدعى Cardiac يمكن أن يحاكي الأسئلة التي سيطلبها الممرض لمريض يعاني من أمراض القلب. تم إنشاء البرنامج بتمويل من المعاهد الوطنية الأمريكية للصحة. مع هذا النظام ، بمجرد تزويد المستخدم بالمعلومات ، لن يطلب النظام ذلك مرة أخرى ، قال ألين. سيشير النظام إلى المادة التي تم توفيرها بالفعل وما الذي كان لا يزال مطلوبًا.

وهناك برنامج آخر صممه ألن وفريقه ، يدعى Plow ، يستطيع تعلم كيفية تنفيذ المهام الشائعة على الكمبيوتر. "هذا هو النظام الذي يسمح لك باستخدام الحوار بشكل أساسي لتدريب النظام الخاص بك على كيفية القيام بالأشياء من أجلك." على سبيل المثال ، أظهر ألين البرنامج تعلم كيفية العثور على المطاعم القريبة باستخدام المتصفح. سيقوم المستخدم بفتح متصفح ، والانتقال إلى موقع محدد مطعم ، اكتب في نوع مطعم سعى والموقع ، ثم قص ولصق النتائج في صفحة فارغة. وصف المستخدم كل خطوة أثناء تنفيذه.

في هذه العملية ، يقوم المحراث بتسجيل كل خطوة ، والاستجابة بصوت مسموع عند فهم هذه الخطوة. في وقت لاحق ، عندما يرغب المستخدم في البحث عن مطعم آخر ، سيخضع البرنامج لجميع الحركات نفسها ، وينتج قائمة أخرى من المطاعم تلقائيًا. وقد قامت وكالة مشاريع الأبحاث المتقدمة التابعة لوزارة الدفاع الأمريكية بتمويل تطوير هذا البرنامج.

المزيد من البيانات هي المفتاح لأنظمة معالجة اللغات الأكثر شبهاً للإنسان ، وهو عالم متفق عليه من شركة مايكروسوفت للخطاب لاري هيك ، في حديث آخر في المؤتمر. وقال: "إذا لم تكن لديك البيانات ، فلا يهم مدى تطور الخوارزميات الخاصة بك." تحصل خدمات محركات البحث على أعداد هائلة من الاستفسارات ، والتي يتم ربطها جميعًا بالإجابات. وقال هيك: "أرى أن البحث هو بمثابة ابن عم قريب لتكنولوجيا معالجة اللغة."

في هذه الأيام ، يتم تدريب الأشخاص على بناء استفساراتهم كمجموعة من الكلمات الرئيسية. بدلاً من ذلك ، إذا كان المستخدمون يقومون بكتابة جمل كاملة تصف ما يحتاجون إليه ، فإن مجموعة البيانات الناتجة يمكن أن تقطع شوطا طويلا في مساعدة الأنظمة على فهم أفضل لما يبحث عنه الناس.

تنبأ هيك بأن المزيد من الناس يستخدمون خدمات البحث التي يتم تفعيلها عن طريق الصوت من Microsoft و Google ، سيصبحون أكثر اعتادًا على تنظيم استعلاماتهم كجمل كاملة ، والتي بمرور الوقت يمكن أن تساعد أنظمة البرمجة اللغوية العصبية على توقع احتياجات المستخدم بشكل أفضل.

Joab Jackson يغطي برامج المؤسسة والتكنولوجيا العامة الأخبار العاجلة عن

The IDG News خدمة

. اتبع Joab على تويتر علىJoab_Jackson. عنوان البريد الإلكتروني لـ Joab هو [email protected]