ذكري المظهر

Google: حققنا اختراقًا في بحث الصور

The Thinning

The Thinning
Anonim

قد يتفوق البشر في التعرف على الأنماط ، ولكن أجهزة الكمبيوتر ليست ذكية للغاية في تحديد الصور. يمكن لأدمغتنا أن تحدد على الفور صور المعالم الشهيرة مثل تمثال الحرية أو سور الصين العظيم ، لكن الحواسيب عادة ما تكون بدون علامات نصية كصوت خادع.

قد يكون هذا التغيير ، إذا كان مشروع بحث Google في "رؤية الكمبيوتر" تنطلق. قدم عملاق البحث يوم الاثنين ورقة عن التعرف على المعالم في مؤتمر الرؤية والحاسب الآلي (CVPR) في ميامي. التكنولوجيا الجديدة تسمح لأجهزة الكمبيوتر بسرعة I.D. صور أكثر من 50000 من معالم العالم مع دقة 80 في المئة ، تقول غوغل.

تسارع Google إلى الإشارة إلى أن تقنية التعرف على الأنماط لا تزال مشروعًا بحثيًا وليست خدمة جديدة. هذا منطقي ، كأداة بحث صحيحة ، فقط 8 من 10 محاولات ليست جاهزة في وقت الذروة. ومع ذلك ، فإن هذا المفهوم رائع للغاية ويمكن أن يشكل نعمة للمسافرين إذا كان بإمكان Google في يوم ما تعزيز معدل الدقة. أعتقد أن القدرة على التقاط صورة لمعلم مجهول وجعل هاتفك الذكي أو الكاميرا التي تدعم الشبكة ستحددها على الفور. بالطبع ، هناك أيضا إمكانية للتطبيقات العلمية والاستهلاكية التي لم يخطر ببال أحد حتى الآن.

فكيف تعمل؟ يشرح جاي ياجنيك ، رئيس قسم أبحاث الكمبيوتر في Google ، في مشاركة مدونة. تتمثل الخطوة الأولى في استخدام 40 مليون صورة تم وضع علامة عليها بواسطة نظام تحديد المواقع العالمي من خدمتي Google و Picasa و Panoramio وصفحات الويب للمرشدين السياحيين عبر الإنترنت لتجميع قائمة من المعالم. "بعد ذلك ، وجدنا صورًا مرشحة لكل معلم باستخدام هذه المصادر وبحث الصور من Google ، والتي" تم تشذيبها "باستخدام تقنية مطابقة الصور وتقنيات التجميع غير الخاضعة للإشراف" ، كما يكتب

الخطوة الأخيرة هي تطوير نظام فهرسة لـ التعرف السريع على الصور. ولكن على الرغم من ذكاء المشروع ، إلا أن البحث الدقيق عن الصور لا يزال صعبًا. كما تشير الصورة أدناه ، قد تتشارك المعالم غير ذات الصلة بميزات معمارية مشابهة ؛ أيضًا ، يمكن أن يؤدي إدراج شعار أو راية هائلة إلى تطابق خاطئ.

نأمل أن يعمل مشروع بحث Google على تحسين بحث الصور ، والذي يعتمد اليوم كثيرًا على وضع العلامات. ستكون الخطوة التالية هي إيجاد طريقة لتحديد عدد لا يحصى من الصور غير البارزة ، ولكن هذه المهمة تبدو أكثر صعوبة بشكل لا نهائي.