الرجاء تفعيل الجافاسكربت في متصفحك ليعمل الموقع بشكل صحيح.

البيانات المظلمة: قمة الجليد من كنز الشركات الضائع

4 دقائق
البيانات المظلمة
حقوق الصورة: إيلينا أزرابيفيتش/ شترستوك. تعديل إم آي تي تكنولوجي ريفيو العربية.

تُصنف بيانات أي مؤسسة إلى 3 أنواع، النوع الأول، هو بيانات العمل المهمة لتسيير الأعمال، وضمان تحقيق الأهداف والنمو. والنوع الثاني هو البيانات غير المهمة والتي لا حاجة لها في تطوير الأعمال. أما النوع الثالث، وهو الأكثر أهمية؛ البيانات المظلمة.

ما هي البيانات المظلمة؟

أثناء أنشطة العمل العادية، تجمع الشركات المعلومات وتعالجها وتخزنها، لكنها تفشل في الكثير من الأحيان في استخدامها في التحليلات أو في غيرها من الأغراض كتحقيق الدخل مثلاً. وعادةً ما يؤدي تخزين البيانات وتأمينها إلى تكبد نفقات أكثر (وفي بعض الأحيان مخاطر أكبر) من قيمتها. تطلق شركة جارتنر (Gartner) على هذا النوع من البيانات اسم البيانات المظلمة (Dark Data).

يمكن فهم ماهية البيانات المظلمة من المثال التالي: تمثّل الصور على موقع إنستقرام وأسماء الملفات الشخصية بيانات مرئية، أما عدد مرات تسجيل دخول المستخدم، وتركيز نشاطه في وقت محدد من اليوم، وموقع التقاط الصورة، تمثّل جميعها بيانات مظلمة يمكن الاستفادة منها.

اقرأ أيضاً: في زمن فيروس كورونا: أبرز النصائح والخطوات لحماية المعلومات والبيانات

بكم تُقدّر نسبة البيانات المظلمة؟

البيانات غير المعروفة أو غير المكتشفة أو غير المحددة الكمية أو غير المستغلة، جميعها مرادفات لمصطلح البيانات المظلمة، ولتحديد نسبتها، أجرت  (ترو جلوبال ريسيرتش) برعاية شركة سبلانك (Splunk) استطلاع رأي عالمي شمل آراء أكثر من 1300 من مديري الأعمال وقادة تكنولوجيا المعلومات حول العالم، لمعرفة كيفية قيام مؤسساتهم بجمع البيانات وإدارتها واستخدامها. وفي النتيجة وجدوا أن نسبة البيانات المظلمة بالمتوسط تبلغ 55% من بيانات المؤسسات. 

قال ثلث المشاركين في الاستطلاع أن 75% من بيانات مؤسساتهم هي بيانات مظلمة، بينما يعتبر آخرون أنها تمثل 11% فقط. ويقول المشاركون الصينيون أن 44% من بيانات مؤسساتهم مظلمة، أما الفرنسيون واليابانيون فيعتبرون أن 65% منها مظلمة.

اقرأ أيضاً: كيف يمكن لأمانات البيانات أن تحمي خصوصيتنا؟

إدراك أهمية البيانات المظلمة وكيفية الاستفادة منها

تعتبر العديد من الشركات أن تحديد ماهية البيانات المظلمة أمراً مربكاً، خاصة مع عدم إدراك أهميتها أو فهم الغاية منها. ولذلك يجب أن تعرف الشركات أن هذه البيانات ذات قيمة عالية، يمكن أن توفر كميات هائلة من المعرفة التي يمكن استخدامها لجذب عملاء جدد وزيادة النمو وتحقيق أرباح أكبر. وعلى حد تعبير وزير الدفاع الأميركي الأسبق «دونالد رامسفيلد»، فإن البيانات المظلمة مجهولة ومعروفة تماماً. ويستخدم هذا المفهوم في دوائر الاستخبارات للإشارة إلى متغيرات ذات قيمة غير معروفة ومع ذلك تُعتبر مهمة. في حالتنا، تعرف الشركة أن التقارير القديمة موجودة في السجلات، لكنها لا تعرف ما هي الرؤى التي قد تحملها.

للاستفادة من البيانات المظلمة، يجب تحليلها، والطريقة الأنسب لتحليل هذا الكم الهائل من البيانات وبسرعة هي الذكاء الاصطناعي. لكن قبل تحليل هذه البيانات على المؤسسات اكتشافها، لأجل ذلك، يمكنهم تعيين مستشار مستقل لتقييم بيئتها والبحث بدقة عن البيانات المظلمة المخفية، بالإضافة إلى فرق المطورين ومهندسي البيانات والمحللين لجمع البيانات ومعالجتها، وللمساعدة في العثور على الثغرات الأمنية ونقاط الضعف والأنشطة الضارة التي قد تعرض بيانات المؤسسة للخطر.

يساعد الذكاء الاصطناعي في الاستفادة بشكل أكبر من هذه البيانات، ويصبح بإمكانه مساعدة المؤسسات على تحديد القسم الذي يمتلك هذه البيانات في المؤسسة، ونوع البيانات التي تمتلكها الإدارة والقيادة، والبيانات التي يجب امتلاكها. كما يمكن استخدامه لتحسين عمليات ضمان الجودة وكشف وتصحيح الأخطاء والبحث عن ثغرات الخصوصية ونقاط الضعف الأمنية وغيرها.

وبشكل عام، يمكن لأي مجال أو صناعة الاستفادة من عمليات جمع البيانات والتعلم الآلي. فمثلاً يمكن استخدام البيانات التي تم جمعها بواسطة أجهزة الاستشعار والكاميرات في تحليل سلوك الحيوانات، وتحسين الحجوزات في صالونات الحلاقة، والتنبؤ بأعطال الآلات في المصانع، وتزويد الشركات ببيانات حول سلوك العملاء لتقديم توصيات وعروض ترويجية ذات طابع شخصي.

إذا كان بإمكان الشركة ربط البيانات المتوفرة بالسؤال التجاري الصحيح، فإن الإجابة ستقدم لها قيمة جديدة. لكن إيجاد الإجابة يستغرق الكثير من الوقت والمال، ما يشكل لب المشكلة، فالفرق المسؤولة عن صياغة رؤية الشركة تجد نفسها غارقة في بحر من البيانات، وتضطر إلى إعطاء الأولوية للمهام العاجلة والتكتيكية، بينما تظل الأبحاث الأكثر جوهرية والاستراتيجية دون أن تُمس. في الوقت نفسه، فإن البيانات التي لم تشرع الفرق في تحليلها بفعالية تصبح مظلمة، ما يجعلها بلا قيمة ملموسة بالنسبة للشركة.

اقرأ أيضاً: قراصنة المعلومات يسرقون البيانات اليوم لتتمكن الحواسيب الكمومية من كسر حمايتها فيما بعد

ما الذي يجب أن تفعله الشركات؟ 

عندما تقرر شركة ما أنه حان الوقت لتستفيد من البيانات المظلمة، يجب أن تكون قادرة على: 

  • تبنّي التقنيات الناشئة، وخاصة الذكاء الاصطناعي والتعلم الآلي، بما يناسب مجال العمل.
  • بناء ثقافة تتمحور حول البيانات، قبل التفكير في الاستفادة من أحد أنواعها الذي هو البيانات المظلمة.
  • تكثيف توظيف أصحاب المواهب والخبراء في التعامل مع البيانات.
  • توفير فرص التدريب للعمال الحاليين في الشركة على أهمية البيانات وكيفية الاستفادة منها.

أنواع البيانات المظلمة

تختلف أنواع البيانات المظلمة حسب كل صناعة وشركة، ولكن الأمثلة الشائعة تشمل:

  • جداول البيانات المالية.
  • مستندات قديمة.
  • ملفات الموظفين السابقين.
  • بيانات تحديد الموقع الجغرافي.
  • سجلات مكالمات العملاء.
  • مراسلات البريد الإلكتروني.

في المختصر يمكن لأي شيء يُرسل عبر الإنترنت أن يكوّن بيانات مظلمة. ويمكن القول أنها البيانات التي تُركت من العمليات والأعمال، مبعثرة عبر كل مستوى من مستويات العمل، يتجاهلها القسم الذي أنتجها ويعتبرها غير ضرورية، ولكنها قد تكون ذات قيمة عالية لقسم آخر.

اقرأ أيضاً: حقوق البيانات الجماعية قد تمنع الشركات التكنولوجية الكبيرة من تدمير الخصوصية

الخصوصية والبيانات المظلمة

عند استخدام التكنولوجيا، يترك الناس الكثير من البيانات التي يمكن اعتبارها مظلمة دون أن يشعروا بذلك. في بعض الأحيان، لا يكون لديهم أدنى مشكلة في أن يطلع عليها أحد، لكن غالبية البيانات لا يريد أصحابها أن يعرف الآخرون عنها شيئاً، مثل عمليات البحث على غوغل، أو معلوماتهم الطبية وغيرها. لذلك يمثل الأمان والخصوصية تحدياً كبيراً أمام الاستفادة من البيانات المظلمة.

من الممكن أن يكون إخفاء هوية المستخدم أحد الحلول، وذلك عبر إزالة أي أرقام حسابات وأسماء وعناوين بريد إلكتروني وما إلى ذلك من بيانات الشخص حتى لا لا يتم التعرف عليها مباشرة. لكن في عالم التكنولوجيا، يكفي معرفة 5 نقاط بيانات عن الشخص لمعرفة هويته، لذلك لا يعتبر إخفاء الهوية حلاً مفيداً، ويجب إيجاد بديل له.

أحد البدائل التي أثبتت فعاليتها هو التعامل مع شركات تضمن الحفاظ على خصوصية البيانات. منها أوبن مايند (OpenMined)، وهي مجموعة بحثية مفتوحة المصدر تعمل على الحفاظ على خصوصية البيانات للأفراد والشركات، وذلك بتدريب نماذج التعلم الآلي على الحفاظ على البيانات الحساسة، خاصة الطبية منها.

المحتوى محمي