اشترك

الاستمرار بالحساب الحالي

شارك
شارك


قام الباحثون بتحويل 2,000 من مقاطع الفيديو إلى صور ثنائية الأبعاد إلى جانب بيانات عالية الدقة عن العمق، وقاموا باستخدام ذلك لتدريب شبكة عصبونية.

2019-07-15 15:07:43

15 يوليو 2019
Article image
مصدر الصورة: نيكسوس | يوتيوب
عد بذاكرتك عن الإنترنت إلى العام 2016. هل تتذكر بعض الأشياء عن تحدي المانيكان؟ حسناً، يتم الآن استخدام تلك الصيحة التي انتشرت على يوتيوب بشكل سريع في ذلك العام لتدريب شبكة عصبونية على فهم المشاهد ثلاثية الأبعاد. خلفية الخبر نحن نجيد بشكل طبيعي تفسير الفيديوهات ثنائية الأبعاد على أنها مشاهد ثلاثية الأبعاد، لكن الآلات تتطلب تعليمها كيفية القيام بذلك. ومن المفيد امتلاك مثل هذه المهارة؛ حيث إن القدرة على إعادة بناء العمق (البعد الثالث)، وترتيب الأغراض المتحركة بحرّية، يمكنه أن يساعد الروبوتات على المناورة في بيئات غير مألوفة. وهذا هو السبب في أن التحدي قد أسر اهتمام الباحثين في مجال الرؤية الحاسوبية لفترة طويلة، خاصة في مجال السيارات ذاتية القيادة. مصدر الفيديو: نيكسوس | يوتيوب البيانات لمعالجة هذه المشكلة، لجأ فريق بقسم الذكاء الاصطناعي في جوجل (جوجل إيه آي) إلى مجموعة غير متوقعة من البيانات: (الآلاف من فيديوهات يوتيوب عن أناس يؤدون تحدي المانيكان). إذا صادف أنك قد فوتّ مشاهدة أي منها في ذلك العام، فإن هذا التحدي ينطوي على الوقوف بثبات قدر الإمكان بينما يقوم شخص ما يتحرك من حولك بتصوير وضعيتك من جميع الزوايا. وتعد هذه الفيديوهات أيضاً مصدراً جديداً للبيانات لفهم العمق في الصور ثنائية الأبعاد. الطريقة قام الباحثون بتحويل 2,000 مقطع من مقاطع الفيديو إلى

أدخل بريدك الإلكتروني واقرأ المقال مجاناً

أنشئ حساباً مجاناً واقرأ مقالتين مجاناً كل شهر من أوسع تشكيلة محتوى أنتجته ألمع العقول العالمية والعربية.



مراسلة الذكاء الاصطناعي ، إم آي تي تكنولوجي ريفيو