تقدم Microsoft عروضًا توضيحية لمترجم عالمي من الإنجليزية إلى الصينية يحافظ على صوتك ولهجتك

مترجم عالمي ستار تريك

في حدث أقيم في الصين ، أظهر ريك راشد ، رئيس قسم الأبحاث في Microsoft ، محرك ترجمة الكلام إلى كلام من الإنجليزية إلى الماندرين في الوقت الفعلي. ليست الترجمة دقيقة للغاية فحسب ، بل يحافظ البرنامج أيضًا على لهجة المستخدم ونبرة الصوت. نحن لا نتحدث فقط عن مترجم آلي رقمي هنا - فهذا يقع بقوة في نطاقات دكتور من أو ستار تريك ترجمة عالمية.

أفضل طريقة لتقدير هذه التقنية هي مشاهدة الفيديو أدناه. الدقائق الست الأولى أو نحو ذلك هي شرح ريك راشد للصعوبة الأساسية لترجمة الكمبيوتر ، ثم توضح الدقائق القليلة الأخيرة محرك ترجمة الكلام إلى كلام من الإنجليزية إلى الماندرين. للأسف ، أنا لا أتحدث الصينية ، لذلك لا يمكنني أن أشهد على صحة الترجمة ، لكن الجمهور - حوالي 2000 طالب صيني - يبدو معجبًا إلى حد ما. كما لاحظ لي مترجم إنجليزي / صيني محترف أن ترجمة الكمبيوتر جيدة بشكل مدهش ؛ لا ترقى تمامًا إلى مستوى الترجمة البشرية ، لكنها تقترب.





هناك بالطبع الكثير من السحر التكنولوجي تحدث وراء الكواليس. كبداية ، يحتاج البرنامج إلى التدريب - مع بضع ساعات من اللغة الصينية الأصلية المنطوقة ، وساعة من اللغة الإنجليزية المنطوقة لريك راشد. من هذا ، يقوم البرنامج بشكل أساسي بتقسيم كلامك إلى أصغر المكونات (الصوتيات) ، ثم دمجها معًا مع المكافئ الصيني ، مما يؤدي إلى إنشاء خريطة كبيرة من الإنجليزية إلى أصوات الماندرين. بعد ذلك ، أثناء العرض التقديمي الفعلي على المسرح ، يحول البرنامج حديثه إلى نص (كما ترى على الشاشة اليسرى) ، ونصه إلى نص الماندرين (الشاشة اليمنى) ، ثم مزيج راشد / الصيني الذي تم إنشاؤه أثناء التدريب يتم استخدام العملية لتحويل هذا النص إلى كلمات منطوقة.

تحتوي النتيجة النهائية بالتأكيد على تلميح قوي لمايكروسوفت سام الروبوتية الرقمية ، ولكن من المدهش كم تم الحفاظ على لهجة راشد وجرسه ونغماته.



فيما يتعلق بالدقة ، تقول Microsoft أن النظام الكامل لديه معدل خطأ يقارب كلمة واحدة من كل ثمانية - وهو تحسن بنسبة 30٪ عن أفضل كلمة سابقة من كل خمسة. تم تمكين هذا التحسن الدراماتيكي من خلال استخدام الشبكات العصبية العميقة، وهي تقنية للتعلم الآلي ابتكرها جيفري هينتون من جامعة تورنتو. الشبكة العصبية العميقة هي في الأساس شبكة عصبية اصطناعية (برنامج يقوم بنمذجة الآلاف من 'الخلايا العصبية' المترابطة) ، ولكن مع بعض التعديلات بحيث تحاكي بشكل أوثق سلوك الدماغ البشري.

من الآن فصاعدًا ، فإن السؤال الكبير هو متى سيجد برنامج ترجمة الكلام إلى كلام من Microsoft Research طريقه بالفعل إلى السوق - ونعم ، في حال كنت تتساءل ، لا يقتصر البرنامج على اللغة الإنجليزية والصينية فقط ؛ يمكن استخدام جميع اللغات البالغ عددها 26 التي يدعمها Microsoft Speech Platform ، بما في ذلك الماندرين إلى الإنجليزية. ستكون حالة الاستخدام الأكثر وضوحًا على هاتفك الذكي الذي يعمل بنظام Windows Phone 8 (أو 9؟) ، أو Skype: يمكنك الاتصال بشركة في الصين أو ألمانيا أو البرازيل ، والتحدث بشكل طبيعي باللغة الإنجليزية ، وسيسمعون صوتك بلغتهم المحلية . يمكنك أيضًا استخدام هاتفك الذكي كمترجم عالمي أثناء السفر. كما ترى أدناه ، كانت Microsoft تتعامل مع الترجمة الفورية من الهاتف إلى الهاتف طوال عام 2010:

من المفترض أن Microsoft تعمل على مثل هذه التطبيقات - ولكن من المحتمل أن تتراجع بسبب اعتبارات عملية ، مثل قوة المعالجة المطلوبة للقيام بترجمة الكلام إلى كلام ، أو توفير واجهة سهلة الاستخدام لعملية التدريب / التعلم. قد تتطلب عملية التدريب نفسها قوة معالجة أكبر مما يمكن للمستخدم المنزلي توفيره عمليًا أيضًا. مع ذلك ، هناك دائمًا السحابة!

Copyright © كل الحقوق محفوظة | 2007es.com