الحوسبة غير المتزامنة AMD و Nvidia و DX12: ما نعرفه حتى الآن

AMD مقابل NV

منذ الإعلان عن DirectX 12 ، تنافست AMD و Nvidia للحصول على منصب بخصوص أي منهما سيعرض دعم أفضل لواجهة برمجة التطبيقات الجديدة وميزاتها المختلفة. إحدى الإمكانيات التي تحدثت عنها AMD بشكل مكثف هي دعم GCN حساب غير متزامن. تسمح الحوسبة غير المتزامنة لجميع وحدات معالجة الرسومات القائمة على بنية GCN من AMD بأداء الرسومات وحساب أعباء العمل في وقت واحد. في الأسبوع الماضي ، أبلغ أحد موظفي Oxide Games أنه خلافًا للاعتقاد العام ، فإن أجهزة Nvidia لا يمكن أداء الحوسبة غير المتزامنة وأن تأثير محاولة القيام بذلك كان كارثيًا على أجهزة الشركة.

أدى هذا الإعلان إلى بدء موجة من الأبحاث حول ما فعلته أجهزة Nvidia وما لم تدعمه ، بالإضافة إلى الادعاءات القصصية بأن الأشخاص (أو فعلوا ذلك بالفعل) يعيدون بطاقات GTX 980 Ti الخاصة بهم بناءً على رماد التفرد أداء. لقد أمضينا الأيام القليلة الماضية في محادثة مع مصادر مختلفة تعمل على حل المشكلة ، بما في ذلك Mahigan و CrazyElf في Overclock.net ، بالإضافة إلى تحليل مجموعات البيانات وتقارير الأداء المتنوعة. لم تستجب Nvidia لطلبنا للتوضيح حتى الآن ، ولكن إليك الموقف كما نفهمه حاليًا.



Nvidia و AMD والحساب غير المتزامن

عندما تتحدث AMD و Nvidia عن دعم الحوسبة غير المتزامنة ، فإنهما لا يتحدثان عن نفس قدرة الأجهزة. إن محركات الأوامر غير المتزامنة في وحدات معالجة الرسومات الخاصة بـ AMD (بين 2-8 اعتمادًا على البطاقة التي تمتلكها) قادرة على تنفيذ أحمال عمل جديدة في أوقات انتقال منخفضة مثل دورة واحدة. تحتوي بطاقة AMD المتطورة على ثمانية ACEs ولكل ACE ثمانية قوائم انتظار. في المقابل ، يمتلك ماكسويل خطي أنابيب ، أحدهما خط أنابيب رسومات ذو أولوية عالية. الآخر يبلغ عمق قائمة الانتظار 31 - لكن Nvidia لا يمكنها تبديل السياقات في أي مكان قريب بأسرع ما يمكن لـ AMD.



NV- الاستباق

وفقًا لمحادثة تم تقديمها في GDC 2015 ، هناك قيود على إمكانات Nvidia المسبقة. يوضح النص الإضافي الموجود أسفل الشريحة أن 'وحدة معالجة الرسومات يمكنها فقط تبديل السياقات عند رسم حدود الاتصال' و 'في وحدات معالجة الرسومات المستقبلية ، نحن نعمل على تمكين إجراءات استباقية أدق ، ولكن لا يزال الطريق بعيدًا.' لاستكشاف الإمكانات المختلفة لـ Maxwell و GCN ، استخدم المستخدمون في Beyond3D و Overclock.net اختبارات الحوسبة غير المتزامنة التي قيمت القدرة على كل من أجهزة AMD و Nvidia. تمت مراجعة المعيار عدة مرات على مدار الأسبوع ، لذا لا يمكن مقارنة النتائج الأولية بالبيانات التي رأيناها في عمليات التشغيل اللاحقة.



لاحظ أن هذا اختبار للحساب غير المتزامن وقت الإستجابةوليس الأداء. هذا لا يختبر الإنتاجية الإجمالية - بعبارة أخرى ، فقط المدة التي يستغرقها التنفيذ - وقد تم تصميم الاختبار لتوضيح ما إذا كانت الحوسبة غير المتزامنة تحدث أم لا. نظرًا لأن هذا اختبار زمن انتقال ، فإن الأرقام المنخفضة (أقرب إلى الخط الأصفر '1') تعني أن النتائج أقرب إلى المثالية.

راديون R9290

إليكم أداء R9290. الخط الأصفر هو الكمال - هذا ما سنحصل عليه إذا تم تبديل وحدة معالجة الرسومات وتنفيذها على الفور. يوضح المحور ص في الرسم البياني أداءً عاديًا إلى 1x ، وهو المكان الذي نتوقع أن يكون فيه وقت استجابة مثالي غير متزامن. الخط الأحمر هو أكثر ما يهمنا. إنه يُظهر أداء GCN بشكل مثالي تقريبًا في معظم الحالات ، مع الحفاظ على الأداء ثابتًا حتى مع ارتفاع عدد الخيوط. الآن ، قارن هذا بـ GTX 980 Ti من Nvidia.



vevF50L

تؤدي محاولة تنفيذ الرسومات والحساب بشكل متزامن على GTX 980 Ti إلى حدوث انخفاضات وارتفاعات في الأداء وقليل من المكاسب. في الوقت الحالي ، لا يوجد سوى عدد قليل من عدد سلاسل الرسائل حيث تتطابق Nvidia مع الأداء المثالي (زمن الوصول ، في هذه الحالة) والعديد من الحالات التي لا تتطابق معها. أشارت التحقيقات الإضافية إلى أن خط أنابيب Nvidia غير المتزامن يبدو أنه يعتمد على وحدة المعالجة المركزية في بعض خطواته الأولية ، بينما يتولى GCN من AMD المهمة في الأجهزة.

في الوقت الحالي ، تشير أفضل الأدلة المتاحة إلى أنه عندما تتحدث AMD و Nvidia عن الحوسبة غير المتزامنة ، فإنهما يتحدثان عن قدرات مختلفة تمامًا. في الواقع ، ليس 'الحساب غير المتزامن' بالضرورة أفضل اسم لما يحدث هنا. السؤال هو ما إذا كانت وحدات معالجة الرسومات Nvidia يمكنها تشغيل الرسومات وحساب أعباء العمل أم لا في نفس الوقت. يمكن لـ AMD ، من باب المجاملة من وحدات ACE.

لقد تم اقتراح أن نهج AMD يشبه إلى حد كبير Hyper-Threading ، والذي يسمح لوحدة معالجة الرسومات بالعمل على أعباء عمل الحوسبة والرسومات المتباينة في وقت واحد دون فقدان الأداء ، بينما قد تعتمد Nvidia على وحدة المعالجة المركزية في بعض خطوات الإعداد الأولية ومحاولة جدولة الحوسبة المتزامنة + عبء عمل الرسومات للتنفيذ المثالي. من الواضح أن هذه العملية لا تعمل بشكل جيد حتى الآن. منذ مقالتنا الأولية ، ذكر Oxide منذ ذلك الحين ما يلي:

'لقد تحدثنا للتو مع Nvidia حول Async Compute ، بالفعل لم يقم السائق بتنفيذها بالكامل حتى الآن ، ولكن بدا كما هو. نحن نعمل بشكل وثيق معهم أثناء قيامهم بتنفيذ Async Compute بالكامل '.

وإليك ما يعنيه ذلك على الأرجح ، بالنظر إلى عروض Nvidia التقديمية في GDC ومعايير الاختبار المختلفة التي تم تجميعها خلال الأسبوع الماضي. لا يمتلك Maxwell تكوينًا على غرار GCN لمحركات الحوسبة غير المتزامنة ولا يمكنه التبديل بين الرسومات وحساب أعباء العمل بسرعة مثل GCN. وفقًا لمستخدم Beyond3D ext3h:

'كانت هناك ادعاءات في الأصل ، أن وحدات معالجة الرسومات Nvidia لن تكون قادرة حتى على تنفيذ تظليل الحوسبة غير المتزامنة بطريقة غير متزامنة على الإطلاق ، تم فضح هذه الأسطورة بسرعة. ما أصبح واضحًا ، مع ذلك ، هو أن وحدات معالجة الرسومات Nvidia تفضل حمولة أخف بكثير من بطاقات AMD. عند الأحمال الصغيرة ، ستدير وحدات معالجة الرسومات Nvidia دوائر حول بطاقات AMD. في حالة التحميل العالي ، حسنًا ، على العكس تمامًا ، حتى النقطة التي استغرقت فيها وحدات معالجة الرسومات Nvidia وقتًا طويلاً لمعالجة عبء العمل الذي أطلقوا الحماية في Windows. الأمر الذي جعل Windows يسحب الزناد ويقتل السائق ، على افتراض أنه عالق.

'النتيجة النهائية (في الوقت الحالي): وحدات معالجة الرسومات AMD قادرة على التعامل مع حمولة أعلى بكثير. حوالي 10 أضعاف ما يمكن أن تتعامل معه Nvidia GPU. لكنهم يحتاجون أيضًا إلى حوالي 4 أضعاف الضغط المطبق قبل أن يلعبوا بالقدرات هناك '.

يستمر Ext3h ليقول إن الإجراءات الوقائية في حالة Nvidia تُستخدم فقط عند التبديل بين سياقات الرسومات (1x رسومات + 31 وضع حساب) و 'سياق حساب خالص' ، لكنه يدعي أن هذه الوظيفة 'كسر تماما'على بطاقات Nvidia في الوقت الحالي. هو يذكر أيضا أنه في حين أن Maxwell 2 (عائلة GTX 900) قادرة على التنفيذ المتوازي ، 'لا تستفيد الأجهزة منها كثيرًا ، نظرًا لأنها لا تحتوي إلا على' فجوات 'قليلة في استخدام التظليل في كلتا الحالتين. لذلك في النهاية ، لا يزال الأمر مجرد تنفيذ تسلسلي لمعظم أعباء العمل ، على الرغم من أنك تمكنت من إيقاف خط الأنابيب بطريقة ما عن طريق إنشاء عبء عمل مؤسف ، فلا يزال بإمكانك الاستفادة منه '.

في غضون ذلك ، مثلت Nvidia لـ Oxide أنها يستطيع تنفيذ الحوسبة غير المتزامنة ، ومع ذلك ، وأن هذه القدرة لم يتم تمكينها بالكامل في برامج التشغيل. مثل Oxide ، سننتظر ونرى كيف يتطور الوضع. يوضح خيط التحليل في Beyond3D أن هذا سؤال معقد بشكل لا يصدق ، والكثير مما قد يفعله أو لا يفعله Nvidia و Maxwell غير واضح.

ذكرنا سابقًا أن أسلوب AMD في الحوسبة غير المتزامنة يشبه بشكل سطحي تقنية Hyper-Threading. هناك طريقة أخرى يمكن من خلالها أن يكون هذا القياس دقيقًا: عندما ظهر Hyper-Threading لأول مرة ، تساءل العديد من معجبي AMD عن سبب عدم نسخ Team Red لهذه الميزة لتعزيز الأداء على K7 و K8. كانت استجابة AMD في ذلك الوقت هي أن معالجات K7 و K8 لديها خطوط أنابيب أقصر بكثير وبنيات مختلفة جدًا ، وكان من غير المحتمل بشكل جوهري الاستفادة من Hyper-Threading نتيجة لذلك. في المقابل ، كان لدى P4 خط أنابيب طويل ومعدل توقف مرتفع نسبيًا. إذا توقف أحد الخيوط ، سمح HT لخيط آخر بمواصلة التنفيذ ، مما عزز الأداء العام للرقاقة.

من غير المرجح أن تعزز الحوسبة غير المتزامنة على غرار GCN أداء Maxwell ، بمعنى آخر ، لأن Maxwell ليس مصممًا حقًا لهذه الأنواع من أعباء العمل. يبقى أن نرى ما إذا كان بإمكان Nvidia التغلب على هذا القيد (أو تنفيذ شيء أسرع).

Copyright © كل الحقوق محفوظة | 2007es.com