content_cookies111:string(1919) "{"id":65648,"content_cookies":null,"user_header":{"SERVER_SOFTWARE":"Apache\/2.4.52 (Debian)","REQUEST_URI":"\/%D8%A3%D8%A3%D8%B5%D8%A8%D8%AD%D9%86%D8%A7-%D9%85%D9%88%D8%B8%D9%81%D9%8A-%D8%A8%D9%8A%D8%A7%D9%86%D8%A7%D8%AA-%D9%84%D8%B0%D9%83%D8%A7%D8%A1-%D8%A7%D9%84%D8%A7%D8%B5%D8%B7%D9%86%D8%A7%D8%B9%D9%8A\/","REDIRECT_STATUS":"200","HTTP_X_FORWARDED_PROTO":"https","HTTP_CONNECTION":"upgrade","HTTP_HOST":"technologyreview.ae","HTTP_CF_CONNECTING_IP":"44.200.101.84","HTTP_CF_IPCOUNTRY":"US","HTTP_ACCEPT_ENCODING":"gzip","HTTP_CF_RAY":"810012698b377fc3-IAD","HTTP_CF_VISITOR":"{\\\"scheme\\\":\\\"https\\\"}","HTTP_USER_AGENT":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)","HTTP_ACCEPT":"text\/html,application\/xhtml+xml,application\/xml;q=0.9,*\/*;q=0.8","HTTP_ACCEPT_LANGUAGE":"en-US,en;q=0.5","HTTP_CDN_LOOP":"cloudflare","PATH":"\/usr\/local\/sbin:\/usr\/local\/bin:\/usr\/sbin:\/usr\/bin:\/sbin:\/bin","SERVER_SIGNATURE":"Apache\/2.4.52 (Debian) Server at technologyreview.ae Port 80<\/address>\n","SERVER_NAME":"technologyreview.ae","SERVER_ADDR":"172.18.0.22","SERVER_PORT":"80","REMOTE_ADDR":"44.200.101.84","DOCUMENT_ROOT":"\/var\/www\/html","REQUEST_SCHEME":"http","CONTEXT_PREFIX":"","CONTEXT_DOCUMENT_ROOT":"\/var\/www\/html","SERVER_ADMIN":"webmaster@localhost","SCRIPT_FILENAME":"\/var\/www\/html\/index.php","REMOTE_PORT":"50086","REDIRECT_URL":"\/\u0623\u0623\u0635\u0628\u062d\u0646\u0627-\u0645\u0648\u0638\u0641\u064a-\u0628\u064a\u0627\u0646\u0627\u062a-\u0644\u0630\u0643\u0627\u0621-\u0627\u0644\u0627\u0635\u0637\u0646\u0627\u0639\u064a\/","GATEWAY_INTERFACE":"CGI\/1.1","SERVER_PROTOCOL":"HTTP\/1.1","REQUEST_METHOD":"GET","QUERY_STRING":"","SCRIPT_NAME":"\/index.php","PHP_SELF":"\/index.php","REQUEST_TIME_FLOAT":1696282492.648891,"REQUEST_TIME":1696282492,"argv":[],"argc":0,"HTTPS":"on"},"user_ip":"44.200.101.84","user_agent":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)"}"
حتى بوتات الدردشة التي تعمل بالذكاء الاصطناعي الأكثر إثارة للإعجاب، تحتاج إلى الآلاف من ساعات العمل البشري كي يبلغ سلوكها المستوى المرغوب بالنسبة لمصمميها، لكن سلوكها يبقى غير موثوق تماماً.
هذه الميزة مخصصة للمشتركين يمكنهم مشاركة المواضيع بحد اقصى 10 مواد من كافة مواقع مجرة
يكمن السر في زيادة ذكاء بوتات الدردشة التي تعتمد على الذكاء الاصطناعي وتقليل إنتاجها للهراء والإساءات في استخدام طريقة تسمى التعلم المعزز من التقييمات البشرية، والتي تعتمد على المُدخلات البشرية لتحسين إجابات النموذج.
تعتمد هذه الطريقة على جيش صغير من مصنفي البيانات البشر الذين يقيّمون الكلمات والعبارات النصية من حيث منطقيتها وانسيابيتها وسياقها الطبيعي، ويتخذون بناء على هذا قراراً بالاحتفاظ بالإجابة في قاعدة البيانات التابعة لنموذج الذكاء الاصطناعي، أو حذفها.
الحاجة إلى العمل البشري مستمرة حتى مع نماذج الذكاء الاصطناعي
حتى بوتات الدردشة التي تعمل بالذكاء الاصطناعي الأكثر إثارة للإعجاب، تحتاج إلى الآلاف من ساعات العمل البشري كي يبلغ سلوكها المستوى المرغوب بالنسبة لمصمميها، وحتى وإن كانت كذلك، فإن سلوكها يبقى غير موثوق تماماً. يمكن لهذا العمل أن يكون مضنياً ومزعجاً للغاية، كما قيل مع انطلاقة مؤتمر جمعية آلات الحوسبة (ACM) حول العدالة والمسؤولية والشفافية "فاكت (FAccT) اختصاراً". يتحدث هذا المؤتمر عن الكثير من الأشياء التي يروق لي الكتابة عنها، مثل كيفية زيادة مسؤولية أنظمة الذكاء الاصطناعي وأخلاقيتها.
سجل في نشرة الخوارزمية
ابق مواكباً لأحدث أخبار وتطبيقات الذكاء الاصطناعي في قطاعك، وتأثيراته المستقبلية على مجال عملك.
تم الإشتراك بنجاح !هناك خطأ ما, حاول مجدداً
وقد كنت أتطلع إلى جلسة حوارية مع الرائدة في أخلاقيات الذكاء الاصطناعي، تيمنيت غيبرو، التي اعتادت المشاركة في إدارة قسم أخلاقيات الذكاء الاصطناعي في جوجل قبل طردها من هناك. تحدثت غيبرو عن استغلال عاملي البيانات في إثيوبيا وأريتريا وكينيا لإزالة خطاب الكراهية والمعلومات المزيفة على الإنترنت. على سبيل المثال، كان مصنفو البيانات في كينيا يحصلون على أقل من دولارين في الساعة لتدقيق مقادير ضخمة من المحتوى المسيء حول العنف والاستغلال الجنسي، كي يصبح تشات جي بي تي (ChatGPT) أقل إساءة. وقد قرر هؤلاء العاملون تأسيس اتحاد خاص بهم لتحسين ظروف العمل.
في سلسلة نشرتها إم آي تي تكنولوجي ريفيو العام الماضي، تحدثنا عن أثر الذكاء الاصطناعي في بناء نظام عالمي استعماري جديد، وتَحمُّل عاملي البيانات العبء الأكبر في ظل هذا النظام. أصبح كشف ممارسات استغلال عمالة الذكاء الاصطناعي أكثر ضرورة وإلحاحاً مع ظهور بوتات الدردشة الذائعة الصيت، مثل تشات جي بي تي وبينغ (Bing) وبارد (Bard) وأنظمة الذكاء الاصطناعي لتوليد الصور، مثل دال-إي 2 (DALL-E 2) وستيبل ديفيوجن (Stable Diffusion).
هل مصنفو البيانات هم الحلقة الأضعف في مراحل تطوير الذكاء الاصطناعي؟
يسهم مصنفو البيانات في جميع مراحل تطوير الذكاء الاصطناعي، بدءاً من تدريب النماذج وصولاً إلى تقييم نتائجها وتقديم الملاحظات التي تتيح معايرة النموذج بدقة بعد إطلاقه. ويضطرون في أغلب الأحيان إلى العمل بوتيرة فائقة السرعة لتحقيق أهداف إنتاجية صعبة بمواعيد نهائية خانقة، وفقاً لباحثة الدكتوراة التي تدرس ممارسات العمل في مجال البيانات في جامعة سيتي في لندن، سرافيا تشانديرامولي.
تقول تشانديرامولي: "إن فكرة بناء هذه الأنظمة الضخمة دون تدخل بشري خاطئة تماماً".
يزود مصنفو البيانات أنظمةَ الذكاء الاصطناعي بالسياق المهم الذي تحتاج إليه لاتخاذ القرارات التي توحي بأنها فائقة التعقيد، وبأعداد كبيرة.
أخبرتني تشانديرامولي بحالة توجّبَ فيها على أحد مصنفي البيانات في الهند التفريق بين صور لزجاجات الصودا، واختيار الزجاجات الشبيهة بمشروب دكتور بيبر. ولكن دكتور بيبر لم يكن أحد المنتجات التي تُباع في الهند، ولهذا تحمّل مصنّف البيانات مسؤولية تحديد ما يجب فعله.
تتوقع الشركات أن يتمكن المصنفون من تحديد القيم المهمة بالنسبة للشركة، وفقاً لتشانديرامولي. وتقول: "لا يقتصر عملهم على تعلّم هذه الأشياء البعيدة عنهم التي لا تحمل أي أهمية بالنسبة لهم على الإطلاق، بل يتعين عليهم تحديد سياقاتها المناسبة، وأولويات الأنظمة التي يشاركون في بنائها".
في الواقع، نحن جميعاً نؤدي دور عاملي البيانات للشركات التكنولوجية الكبرى، سواء أكنا مدركين لذلك أم لا، كما يقول باحثون في جامعة كاليفورنيا في بيركلي، وجامعة كاليفورنيا في ديفيس، وجامعة مينيسوتا، وجامعة نورث ويسترن، في ورقة بحثية جديدة عُرضت في مؤتمر فاكت.
فنماذج الذكاء الاصطناعي للنصوص والصور تخضع للتدريب باستخدام مجموعات بيانات ضخمة جُمِعت من الإنترنت. تتضمن هذه المجموعات بياناتنا الشخصية، وأعمالنا الفنية المحمية بموجب قوانين الملكية الفكرية، وهذه البيانات التي ولّدناها من قبل أصبحت الآن، وإلى الأبد، جزءاً من نموذج ذكاء اصطناعي مبني لتحقيق الأرباح لمصلحة إحدى الشركات. لقد قدمنا خلاصة عملنا دون انتباه منا إلى الشركات مجاناً، وذلك بتحميل صورنا على المواقع العامة، والتصويت على التعليقات في موقع ريديت (Reddit)، وتصنيف الصور على نظام التحقق ري كابتشا (نظام اختبارات مطور للتمييز بين الإنسان والحاسوب اعتماداً على اختبار تورينغ (reCAPTCHA))، وإجراء عمليات البحث على الإنترنت.
في الوقت الحالي، يميل ميزان النفوذ بشدة إلى مصلحة بعض الشركات التكنولوجية الأكبر على مستوى العالم.
ولتغيير هذا الأمر، نحتاج على الأقل إلى ثورة وتنظيم شاملين في مجال البيانات. يقول الباحثون إن إحدى وسائل استعادة الناس التحكم بوجودهم على الإنترنت تقوم على مناصرة الشفافية المتعلقة باستخدام البيانات، وابتكار وسائل تمنح الناس الحق في تقديم الملاحظات والتعليقات، وتقاسم العائدات الناتجة عن استخدام بياناتهم.
ومع أن عمالة البيانات تمثل أساس الذكاء الاصطناعي الحديث، إلا أن إسهامها ما زال حتى الآن خفياً ولا تحوز ما تستحقه من التقدير في أنحاء العالم كافة، وما زالت أجور المصنّفين منخفضة.
تقول تشانديرامولي: "لا يوجد أي اعتراف بإسهام العمل المتعلق بالبيانات على الإطلاق".
ميليسا هيكيلا من كبار مراسلي مجلة إم آي تي تكنولوجي ريفيو، حيث تغطي مواضيع الذكاء الاصطناعي وتأثيره على المجتمع. كتبت سابقاً عن السياسات العامة وسياسة الذكاء الاصطناعي في صحيفة "بوليتيكو" (POLITICO). عملت أيضاً في مجلة "ذي إيكونومست" (The Economist) … المزيد وكانت مذيعة أخبار. صنّفتها مجلة فوربس كواحدة من بين 30 شخصية تقل أعمارهم عن 30 عاماً في قائمة المبدعين في وسائل الإعلام الأوروبية في عام 2020.
نستخدم ملفات تعريف الارتباط لتحسين تجربتك، استمرار استخدامك للموقع يعني موافقتك على ذلك. سياسة الخصوصيةأوافقX
Privacy & Cookies Policy
Privacy Overview
This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.