تكنوضاد ذكاء اصطناعي

البيانات غير المهيكلة | UNSTRUCTURED DATA


ما هي البيانات غير المهيكلة؟

عبارة عن بيانات بأشكال مختلفة لم يتم تنسيقها وفقاً لنموذج بيانات أو مخطط محدد مسبقاً، وبالنتيجة لا يمكن تخزينها في قواعد البيانات العلائقية التقليدية. تنمو البيانات غير المهيكلة بشكل سريع جداً نظراً لتزايد الاعتماد على التطبيقات والخدمات الرقمية. وتشير التقديرات إلى أن ما نسبته 80 إلى 90 بالمئة من البيانات التي يتم توليدها وجمعها من قبل الشركات هي بيانات غير مهيكلة.

تتألف البيانات غير المهيكلة بمعظمها من نصوص وصور ومقاطع فيديو أو صوت وصفحات ويب تم جمعها من مصادر مختلفة. ومن الأمثلة على هذه المصادر المستندات النصية والعروض التقديمية ورسائل البريد الإلكتروني وإجابات الاستبيانات. بالإضافة إلى السجلات والمحادثات والنسخ المكتوبة من مكالمات مراكز الاتصال وخدمة العملاء والمنشورات على مواقع التواصل الاجتماعي والمدونات. كما تعتبر البيانات التي يتم جمعها من أجهزة الاستشعار وتجهيزات المصانع وأجهزة إنترنت الأشياء الأخرى غير مهيكلة أيضاً.

تخزن البيانات غير المهيكلة في مستودعات خاصة مثل بحيرات البيانات وقواعد البيانات غير العلائقية. وتعتبر هذه البيانات ثروة حقيقية من حيث المعلومات الموجودة ضمنها، والتي تستخدم في مجالات واسعة أهمها نظم دعم عمليات اتخاذ القرار. سابقاً كان تحليل هذا النوع من البيانات صعباً للغاية. لكن اليوم وبفضل تقنيات الذكاء الاصطناعي لا سيما التعلم الآلي والتعلم العميق وتنقيب البيانات؛ بات من الممكن تحليل كميات هائلة منها. وذلك بهدف استكشاف الأنماط والتوجهات والأفكار المفيدة للأعمال.


مفاهيم من نفس المحور


مقالات تم ذكر هذا المصطلح فيها


بدعم من تقنيات