content_cookies111:string(1963) "{"id":42413,"content_cookies":null,"user_header":{"SERVER_SOFTWARE":"Apache\/2.4.52 (Debian)","REQUEST_URI":"\/%D9%86%D8%B5%D9%88%D8%B5-%D8%A7%D9%84%D8%B0%D9%83%D8%A7%D8%A1-%D8%A7%D9%84%D8%A7%D8%B5%D8%B7%D9%86%D8%A7%D8%B9%D9%8A-%D8%AA%D8%B3%D9%85%D9%85-%D8%A7%D9%84%D8%A5%D9%86%D8%AA%D8%B1%D9%86%D8%AA\/","REDIRECT_STATUS":"200","HTTP_X_FORWARDED_PROTO":"https","HTTP_CONNECTION":"upgrade","HTTP_HOST":"technologyreview.ae","HTTP_CF_CONNECTING_IP":"44.200.101.84","HTTP_CF_IPCOUNTRY":"US","HTTP_ACCEPT_ENCODING":"gzip","HTTP_CF_RAY":"80a9f3fcbffd2076-IAD","HTTP_CF_VISITOR":"{\\\"scheme\\\":\\\"https\\\"}","HTTP_USER_AGENT":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)","HTTP_ACCEPT":"text\/html,application\/xhtml+xml,application\/xml;q=0.9,*\/*;q=0.8","HTTP_ACCEPT_LANGUAGE":"en-US,en;q=0.5","HTTP_IF_MODIFIED_SINCE":"Tue, 28 Mar 2023 20:32:38 GMT","HTTP_CDN_LOOP":"cloudflare","PATH":"\/usr\/local\/sbin:\/usr\/local\/bin:\/usr\/sbin:\/usr\/bin:\/sbin:\/bin","SERVER_SIGNATURE":"Apache\/2.4.52 (Debian) Server at technologyreview.ae Port 80<\/address>\n","SERVER_NAME":"technologyreview.ae","SERVER_ADDR":"172.18.0.9","SERVER_PORT":"80","REMOTE_ADDR":"44.200.101.84","DOCUMENT_ROOT":"\/var\/www\/html","REQUEST_SCHEME":"http","CONTEXT_PREFIX":"","CONTEXT_DOCUMENT_ROOT":"\/var\/www\/html","SERVER_ADMIN":"webmaster@localhost","SCRIPT_FILENAME":"\/var\/www\/html\/index.php","REMOTE_PORT":"39758","REDIRECT_URL":"\/\u0646\u0635\u0648\u0635-\u0627\u0644\u0630\u0643\u0627\u0621-\u0627\u0644\u0627\u0635\u0637\u0646\u0627\u0639\u064a-\u062a\u0633\u0645\u0645-\u0627\u0644\u0625\u0646\u062a\u0631\u0646\u062a\/","GATEWAY_INTERFACE":"CGI\/1.1","SERVER_PROTOCOL":"HTTP\/1.1","REQUEST_METHOD":"GET","QUERY_STRING":"","SCRIPT_NAME":"\/index.php","PHP_SELF":"\/index.php","REQUEST_TIME_FLOAT":1695379471.069748,"REQUEST_TIME":1695379471,"argv":[],"argc":0,"HTTPS":"on"},"user_ip":"44.200.101.84","user_agent":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)"}"
هذه الميزة مخصصة للمشتركين يمكنهم مشاركة المواضيع بحد اقصى 10 مواد من كافة مواقع مجرة
لقد كانت سنة حافلة بالنسبة للذكاء الاصطناعي. وإذا كنت قد أمضيت الكثير من الوقت على الإنترنت، فمن المرجح أنك رأيت صوراً قامت أنظمة الذكاء الاصطناعي بتوليدها، مثل دال-إي 2 (DALL-E 2) أو ستيبل ديفيوجن (Stable Diffusion)، أو النكات وغيرها من النصوص التي ألفها تشات جي بي تي (ChatGPT)، وهو أحدث إصدار من النموذج اللغوي الكبير جي بي تي 3 (GPT-3) من أوبن أيه آي (OpenAI).
إنتاجات مخادعة
في بعض الأحيان، تكون إنتاجات أنظمة الذكاء الاصطناعي من صور وكتابات واضحة للعيان. ولكن إنتاجات هذه النماذج أصبحت، وعلى نحو متزايد، قادرة على خداعنا بسهولة، ودفعنا إلى الاعتقاد بأنها من إنتاج البشر. وقد أثبتت النماذج اللغوية الكبيرة على نحو خاص أنها بارعة في تأليف الهراء، فهي قادرة على تأليف نص يبدو صحيحاً، ولكنه في الواقع مليء بالمعلومات الخاطئة.
قد لا يبدو هذا مهماً إذا كان الموضوع مجرد مسألة تسلية لا أكثر، ولكنه قد يؤدي إلى عواقب وخيمة عند استخدام نماذج الذكاء الاصطناعي لتقديم النصائح الصحية أو غيرها من المعلومات المهمة دون إشراف بشري. كما يمكن أن تزيد أنظمة الذكاء الاصطناعي من سهولة إنتاج المعلومات الزائفة بكميات كبيرة وسهولة غير مسبوقة، إضافة إلى الإساءات والرسائل المزعجة، ما يؤدي إلى تشويش المعلومات التي نحصل عليها، بل وحتى تشويش صورتنا عن الواقع نفسه. ويمكن أن تكون مدعاة للقلق على نحو بالغ في فترة الانتخابات، على سبيل المثال.
سجل في نشرة الخوارزمية
ابق مواكباً لأحدث أخبار وتطبيقات الذكاء الاصطناعي في قطاعك، وتأثيراته المستقبلية على مجال عملك.
تم الإشتراك بنجاح !هناك خطأ ما, حاول مجدداً
ويطرح انتشار النماذج اللغوية الكبيرة التي يمكن الوصول إليها بسهولة سؤالاً مهماً: كيف سنميز إنتاج البشر من إنتاج الآلات في المواد التي نقرأها على الإنترنت؟ لقد نشرتُ مقالاً حول الأدوات التي يمكننا اللجوء إليها حالياً لكشف النصوص التي ولدها الذكاء الاصطناعي. وأقدم لكم هذا التحذير المسبق: إن مجموعة أدوات الكشف الحالية عاجزة للغاية أمام تشات جي بي تي.
ولكن هناك المزيد من الآثار بعيدة الأمد. فمن المحتمل أننا نشهد -وفي الزمن الحقيقي- ولادة موجة متسارعة ومتزايدة الضخامة من الهراء والنصوص الفارغة.
فقد تم تدريب النماذج اللغوية الكبيرة على مجموعات بيانات تم الحصول عليها من الإنترنت، بما في ذلك جميع الأشياء المسيئة والسخيفة والمزيفة والخبيثة التي كتبها البشر على الإنترنت. وبالتالي، فإن النماذج النهائية تعيد إطلاق هذه المعلومات المزيفة كحقائق، وينتشر إنتاجها في كل مكان على الإنترنت. وعندما تقوم شركات التكنولوجيا بمسح الإنترنت ثانية للحصول على النصوص، ستجمع النصوص التي كتبها الذكاء الاصطناعي لاستخدامها في تدريب نماذج لغوية أكثر ضخامة وأعلى قدرة على الإقناع، والتي سيستخدمها البشر لتوليد المزيد من الهراء، قبل جمعها واستخدامها لتدريب نماذج أخرى، وهكذا دواليك.
وتمتد هذه المشكلة -أي تلقيم الذكاء الاصطناعي بمخرجات من إنتاجه في حلقة مفرغة لإنتاج مخرجات أسوأ- إلى نطاق الصور أيضاً. وقد قال باحث الذكاء الاصطناعي في كلية الملك في لندن، مايك كوك، في مقال جديد لزميلي ويل دوغلاس هيفن حول مستقبل نماذج الذكاء الاصطناعي التوليدي: "لقد تلوثت الإنترنت إلى الأبد بالصور التي ولدها الذكاء الاصطناعي".
"إن الصور التي صنعناها في 2022 ستكون جزءاً من أي نموذج يتم صنعه لاحقاً".
صعوبة العثور على بيانات مناسبة لتدريب النماذج مستقبلاً
وفي المستقبل سيكون من الصعب على نحو متزايد العثور على بيانات تدريب عالية الجودة وخالية بشكل مضمون من إنتاج الذكاء الاصطناعي، كما تقول دافني إيبوليتو، إحدى كبار العلماء في جوجل برين (Google Brain)، وهي الوحدة البحثية الأساسية للشركة في مجال التعلم العميق. وإذا رغبنا في أن نمنع تسرب التحيزات والمعلومات المزيفة إلى أنظمة الذكاء الاصطناعي على عدة درجات مختلفة، لن يعود من الكافي سحب كميات ضخمة من النصوص عن الإنترنت كيفما اتفق.
تقول إيبوليتو: "من المهم للغاية أن ندرس مدى الحاجة الفعلية إلى التدريب باستخدام الإنترنت فقط، أو وجود طرائق نستطيع بمساعدتها فلترة البيانات لزيادة الجودة والحصول على النماذج اللغوية التي نرغب فيها حقاً".
إن بناء أدوات لكشف النصوص التي ولدها الذكاء الاصطناعي سيكون مهماً للغاية عندما يحاول البعض –وهو أمر حتمي- تقديم أوراق علمية أو مقالات أكاديمية قام الذكاء الاصطناعي بتأليفها، أو استخدام الذكاء الاصطناعي لتأليف أخبار مزيفة أو معلومات خاطئة.
قد تستطيع الأدوات التقنية مساعدتنا، ولكن يجب على البشر أن يصبحوا أكثر يقظة وبراعة أيضاً.
تقول إيبوليتو إنه توجد بعض الأدلة التي تميز النص الذي ولده الذكاء الاصطناعي. فالبشر يكتبون بشكل فوضوي. وكتاباتهم مليئة بالأخطاء المطبعية والكلمات العامية، وبالتالي فإن البحث عن هذا الشكل من الأخطاء والتفاصيل الدقيقة وسيلة جيدة لكشف النص الذي كتبه البشر. وفي المقابل، فإن النماذج اللغوية الكبيرة تعمل عن طريق توقع الكلمة التالية في الجملة، وهي أكثر ميلاً لاستخدام الكلمات الشائعة بدلاً من الكلمات الغريبة والنادرة. وعلى الرغم من أنها تكاد لا تخطئ في تهجئة كلمة على الإطلاق، فإنها تعطي نتائج خاطئة دون شك. تقول إيبوليتو إن الناس يجب أن يبحثوا عن التضاربات الخفية أو الأخطاء المتعلقة بالحقائق في النصوص التي يتم تقديمها على أنها معلومات صحيحة، على سبيل المثال.
أما الخبر السار فهو أن الأبحاث تشير إلى أنه يمكن من خلال التدريب زيادة مهارة البشر في كشف النصوص التي ولدها الذكاء الاصطناعي. وربما ما زال الأمل موجوداً.
ميليسا هيكيلا من كبار مراسلي مجلة إم آي تي تكنولوجي ريفيو، حيث تغطي مواضيع الذكاء الاصطناعي وتأثيره على المجتمع. كتبت سابقاً عن السياسات العامة وسياسة الذكاء الاصطناعي في صحيفة "بوليتيكو" (POLITICO). عملت أيضاً في مجلة "ذي إيكونومست" (The Economist) … المزيد وكانت مذيعة أخبار. صنّفتها مجلة فوربس كواحدة من بين 30 شخصية تقل أعمارهم عن 30 عاماً في قائمة المبدعين في وسائل الإعلام الأوروبية في عام 2020.
نستخدم ملفات تعريف الارتباط لتحسين تجربتك، استمرار استخدامك للموقع يعني موافقتك على ذلك. سياسة الخصوصيةأوافقX
Privacy & Cookies Policy
Privacy Overview
This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.