ذكري المظهر

ما القوى الروبوت بوت التي تغلب دندي

How Machines Learn

How Machines Learn

جدول المحتويات:

Anonim

في الأسبوع الماضي ، تم إنشاء التاريخ في عوالم دوتا 2 و AI. في The International ، تعرض Dendi ، أحد أفضل لاعبي اللعبة ، للضرب بلا رحمة في 1v1 ، بواسطة روبوت ، مرتين على التوالي. تم إنشاء الروبوت المعني من قبل OpenAI ، وهي شركة ناشئة لـ Elon Musk.

الآن قد يكون لديك بعض الأسئلة. ما هو دوتا؟ ما هو OpenAI؟ ولماذا هذا مهم؟ بادئ ذي بدء ، Dota هي لعبة MOBA مجانية يمكنك من خلالها التحكم في Heroes وهدفك هو تدمير الخصوم Ancient. كثير من مشجعي دوتا قد يسيئون إلى الجملة الأخيرة لأن هناك الكثير لدوتا ثم لخصت.

اللعبة معقدة للغاية مع منحنى التعلم حاد جدا لذلك. كنت قد شرعت في مهمة لتعلم Dota منذ فترة ، واستغرق الأمر أسبوعًا فقط لأبحث عن فيديو أساسي حول " كيفية اللعب" ، حيث يشرحون إستراتيجية اللعبة ، وما هي الأسلحة ، والتعاويذ ، والأبطال ، وكيفية زحف الألغام. وهذا يجعل معركة AI و Dendi بأكملها مهمة لأنها توضح مدى تقدم AI و ML. لذلك دعونا نرى ما الذي يشغل هذا الروبوت وهل نحتاج أن نخاف من انتفاضة منظمة العفو الدولية.

صعود كوكب الذكاء الاصطناعى

أصبح الذكاء الاصطناعى Skynet مشكلة قابلة للنقاش. يعتقد Elon Musk أنه إذا لم يتم التحقق منه ، فمن المحتمل أن يحدث سيناريو شبيه بـ Skynet. من ناحية أخرى ، يقول مارك زوكربيرج أن الذكاء الاصطناعي غير ضار ولن يسبب سيناريو يوم القيامة. بدأ Elon Musk OpenAI بهذا الهدف.

لمنع إساءة استخدام الذكاء الاصطناعي والبحث في الذكاء الاصطناعي الذي لن ينقلب علينا. وأنا في صفه.

ولكن هذا ليس ما نحن هنا لمناقشة. الموضوع الرئيسي هو معرفة ما يحفز الروبوت الذي صنعه OpenAI. لفهم ذلك ، قرأت بعض الأبحاث والمدوّنات البحثية حول هذا الموضوع واتصلت أيضًا بصديقي Anmol Sharma وهو باحث في منظمة العفو الدولية و ML.

تعزيز التعلم

هذا هو اسم التكنولوجيا وراء الروبوت دوتا OpenAI ل. ولكن قبل الخوض في ذلك ، نحتاج إلى فهم كيفية عمل الذكاء الاصطناعى العام ، أو الذكاء الاصطناعى بالتحديد في ألعاب الفيديو. إن مصطلح الذكاء الاصطناعي هو عبارة عن لوحة إعلانات تتضمن الكثير من الموضوعات مثل التعلم الآلي والتعلم العميق والشبكات العصبية على سبيل المثال لا الحصر. لتعريف الذكاء الاصطناعي بشكل فظ ، يمكننا أن نقول إنها قدرة الكمبيوتر على التعلم من المعلومات واتخاذ القرارات بناءً على تعلمه. كلما تعلمت ، زادت صحة القرار.

كيف تختلف عن بوت العادي؟

قد تبدو روبوتات ألعاب الفيديو العامة أنها ذكية ولكنها ليست شكلاً حقيقياً من أشكال الذكاء الاصطناعي. تتم برمجة جميع هذه السيروتات تقريبًا في الألعاب استنادًا إلى مجموعة إذا … هذا.. ثم.. هذه العبارات. إنهم فقط يتبعون البيانات ويتخذون إجراءات بناءً على الشروط المكتوبة في البيان.

أعلاه لقد أظهرت مثالا بسيطا جدا. تعد البيانات في الألعاب الحقيقية أكثر تعقيدًا مع الشروط في ظل ظروف. كلما كانت هذه العبارات محددة بشكل أكثر تفصيلاً وتفصيلا ، كلما بدا أن البوت ذكي.

المكافآت والعقوبات

في لغة الذكاء الاصطناعى ، ما نسميه بوت هو المعروف بالوكيل. الهدف هو جعل الموظف يتعلم ما نريد أن نتعلمه. يتعلم الوكيل من خلال نفس الطريقة التي يتعلم بها الكلب ، من خلال المكافآت والعقوبات. عندما يرتكب العميل خطأً ، تتم معاقبته ، وكلما ارتكب التخمين الصحيح أو أعطى الإجابة الصحيحة ، تتم مكافأته. من خلال هذا النظام ، يتعلم الوكيل ربط الإجراءات التي يجب ألا يقوم بها لتجنب العقوبة وتنفيذ الإجراء (أو الإجراءات المماثلة) التي تمنح المكافآت.

إذا كنت تفكر في الأمر عن كثب ، فذلك يشبه اتخاذ القرارات بناءً على شروط معينة ، مثلها مثل الخوارزميات. كما أوضحت أعلاه ، فإن روبوت اللعبة ، الذي يأتي على برميل متفجر ، سوف يتخذ الإجراءات حسب الخوارزمية. من الواضح أن الخوارزميات في الذكاء الاصطناعي معقدة للغاية من هذا الأمر ، مما يجعل النظام بأكمله ذكيًا.

عندما وصلنا إلى روبوت OpenAI ، وفقًا للمطورين ، فقد تعلمت اللعبة بأكملها خلال أسبوعين. خلال فترة الأسبوعين بأكملها ، كان يعمل عبر الإنترنت على مدار 24 ساعة طوال أيام الأسبوع ويلعب ضد نسخة منه. هذا هو معلم بارز بالنظر إلى تعقيد اللعبة وحقيقة أنها يمكن أن تغلب دندي.

لماذا لا تزال السيارات بدون سائق هنا؟

كان هذا أحد أول الأسئلة التي برزت في ذهني عندما سمعت عن هذا الحدث برمته. إذا كان باستطاعة الروبوت تعلم مثل هذه اللعبة وتدريب نفسه إلى حد التغلب على أفضل اللاعبين ، فلماذا لا نزال ندير العجلة. وكان هذا هو نفس السؤال الذي أطلقته على صديقي ، السيد أنمول شارما ، الذي قام أيضًا بالبحث في السيارات التي تعمل بدون محركات. هذا ما كان عليه أن يقول.

في اللعبة ، التي تم تطويرها من قبل الإنسان ، وعدد المتغيرات أقل. بالإضافة إلى ذلك ، إذا ارتكب العميل (bot) خطأ ، فإن أسوأ عقوبة هي خسارة مستديرة. في العالم الحقيقي ، خطأ واحد هو الموت.

على الرغم من أن Dota هي لعبة معقدة ، إلا أن المجموعات المحتملة من التحركات والتعاويذ والتكتيكات ، رغم أنها لا تزال كبيرة بشكل غير معقول ، لا تزال محدودة. والأخطاء مسموح بها دون أي عقوبة حقيقية. ولكن في حالة وجود وكيل سيارة بدون سائق ، يمكن أن تؤدي الأخطاء إلى حوادث خطيرة وحتى الموت.

في العالم الواقعي ، فإن عدد المتغيرات التي يتعين على الوكيل مراقبتها لا حصر له والمواقف الناشئة بسبب هذه المتغيرات ، مثل سيارة أخرى متغيرة فجأة حارة ، قفز المشاة أمام السيارة ، لا حصر لها. بالإضافة إلى ذلك ، على حد تعبير جيريمي كلاركسون ، سيكون عليهم اتخاذ قرارات أخلاقية عندما يكونون على وشك وقوع حادث فوري (رغم أن نظريته غير صالحة).

المستقبل

نحن نعلم بالفعل أن الإنسان الآلي المتحكم فيه يقوم بإجراء جراحات جوهرية. القفزة التالية هي الروبوتات التي تسيطر عليها منظمة العفو الدولية أداء ذلك. وهذا فقط في المجال الطبي. سوف تكون الذكاء الاصطناعي بالتأكيد هي التكنولوجيا الجديدة المهيمنة في العقد المقبل في العديد من المجالات. ولكن ، يمكن أيضًا إساءة استخدام AI لأغراض ضارة مثل هجمات DDoS و Ransomware Bots واختراق أجهزة الكمبيوتر أو أنظمة الشركات الأخرى.

فيما يتعلق بدوتا والألعاب الأخرى ، يمكننا أن نتوقع أن نرى مثل هذه الروبوتات الذكية تصنع لألعاب أخرى ، والتي يمكن للاعبين أن يتدربوا على أدائها بشكل أفضل. وهل ذكرت أن OpenAI ستقوم بخيار 5v5 في بطولة العام المقبل؟ لذلك أنا خارج عن تسليط الضوء على مهاراتي دوتا لهزيمة على الأقل روبوتات الغباء المضمنة. الإلهي Rapier هنا جئت!