content_cookies111:string(1748) "{"id":15821,"content_cookies":null,"user_header":{"SERVER_SOFTWARE":"Apache\/2.4.52 (Debian)","REQUEST_URI":"\/technodad\/%D8%A7%D9%84%D8%AA%D8%B9%D9%84%D9%85-%D8%A7%D9%84%D9%85%D8%B9%D8%B2%D8%B2\/","REDIRECT_STATUS":"200","HTTP_X_FORWARDED_PROTO":"https","HTTP_CONNECTION":"upgrade","HTTP_HOST":"technologyreview.ae","HTTP_CF_CONNECTING_IP":"3.236.46.172","HTTP_CF_IPCOUNTRY":"US","HTTP_ACCEPT_ENCODING":"gzip","HTTP_CF_RAY":"80f3a7974e3d07f4-IAD","HTTP_CF_VISITOR":"{\\\"scheme\\\":\\\"https\\\"}","HTTP_USER_AGENT":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)","HTTP_ACCEPT":"text\/html,application\/xhtml+xml,application\/xml;q=0.9,*\/*;q=0.8","HTTP_ACCEPT_LANGUAGE":"en-US,en;q=0.5","HTTP_IF_MODIFIED_SINCE":"Sun, 05 Feb 2023 14:47:57 GMT","HTTP_CDN_LOOP":"cloudflare","PATH":"\/usr\/local\/sbin:\/usr\/local\/bin:\/usr\/sbin:\/usr\/bin:\/sbin:\/bin","SERVER_SIGNATURE":"Apache\/2.4.52 (Debian) Server at technologyreview.ae Port 80<\/address>\n","SERVER_NAME":"technologyreview.ae","SERVER_ADDR":"172.18.0.9","SERVER_PORT":"80","REMOTE_ADDR":"3.236.46.172","DOCUMENT_ROOT":"\/var\/www\/html","REQUEST_SCHEME":"http","CONTEXT_PREFIX":"","CONTEXT_DOCUMENT_ROOT":"\/var\/www\/html","SERVER_ADMIN":"webmaster@localhost","SCRIPT_FILENAME":"\/var\/www\/html\/index.php","REMOTE_PORT":"60092","REDIRECT_URL":"\/technodad\/\u0627\u0644\u062a\u0639\u0644\u0645-\u0627\u0644\u0645\u0639\u0632\u0632\/","GATEWAY_INTERFACE":"CGI\/1.1","SERVER_PROTOCOL":"HTTP\/1.1","REQUEST_METHOD":"GET","QUERY_STRING":"","SCRIPT_NAME":"\/index.php","PHP_SELF":"\/index.php","REQUEST_TIME_FLOAT":1696152288.120864,"REQUEST_TIME":1696152288,"argv":[],"argc":0,"HTTPS":"on"},"user_ip":"3.236.46.172","user_agent":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)"}"
نوع من أنواع التعلم الآلي يقوم على فكرة تعليم وكيل ما بالاعتماد على عواقب أفعاله في بيئة معينة؛ حيث تتم مكافأته عندما يكون سلوكه مرغوباً ومعاقبته عندما يكون سلوكه غير مرغوب. يُعتبر التعلم المعزز نموذج تعلم سلوكي يكون الوكيل فيه قادراً على إدراك وتفسير بيئته؛ وبالتالي يتعلم اتخاذ القرارات الصحيحة عن طريق التجربة والخطأ سعياً للحصول على المكافأة طويلة الأمد.
يتم مكافأة وكيل التعلم المعزز عن طريق إسناد قيم إيجابية للأفعال المرغوبة لتشجيعه على القيام بها. ومعاقبته عن طريق إسناد قيم سلبية للأفعال الخاطئة أو غير المرغوبة لردعه عن القيام بها. ومع الوقت يتعلم ذلك الوكيل تجنب القيم السلبية والسعي نحو القيم الإيجابية للحصول على المكافأة الإجمالية طويلة الأمد وذات القيمة الأعلى؛ وبالنتيجة تحقيق الحل الأمثل.
يختلف التعلم المعزز عن التعلم الموجَّه، ويكمن الفرق في أن التعلم الموجَّه يعتمد على تدريب النموذج بالاعتماد على الإجابات الصحيحة التي تكون مقترنة ببيانات التدريب. بينما في التعلم المعزز لا يوجد إجابات صحيحة أو مجموعة بيانات تدريب إنما يكون الدخل عبارة عن حالة ابتدائية ثم يقرر الوكيل ما سيفعله لأداء المهمة المطلوبة، وبذلك يتعلم من تجربته.
ما أهم تطبيقات التعلم المعزز؟
يستخدم التعلم المعزز اليوم في العديد من تطبيقات الذكاء الاصطناعي في مجال الألعاب وإدارة الموارد والتوصيات المخصصة والروبوتات. ومن أهم الأمثلة على تلك التطبيقات نظام التوصيات في موقع يوتيوب الذي يقوم باقتراح مقاطع فيديو مشابه قد تعجب المستخدم بعد مشاهدته لمقطع معين بناءً على العنوان مثلاً. وفي حال بدأ ذلك المستخدم بمشاهدة أحد المقاطع المقترحة ولم يقم بإنهائه سيفهم النظام أن تلك الاقتراحات ليس جيدة بما فيه الكفاية وسيلجأ إلى مقاربة أخرى في المرة القادمة.
تُعد الألعاب أيضاً من أكثر مجالات استخدام التعلم المعزز شيوعاً، ومن الأمثلة عليها نظام ألفا غو (AlphaGo) المطور من قبل شركة ديب مايند التابعة لجوجل. فقد احترف هذا النظام لعبة غو الصينية المعقدة وتغلب على أحد أقوى لاعبيها على مستوى العالم.
نستخدم ملفات تعريف الارتباط لتحسين تجربتك، استمرار استخدامك للموقع يعني موافقتك على ذلك. سياسة الخصوصيةأوافقX
Privacy & Cookies Policy
Privacy Overview
This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.