تكنوضاد تكنولوجيا

البيانات الضخمة | BIG DATA


عبارة عن مجموعة ضخمة من البيانات والتي تتضمن معلومات وصوراً وأرقاماً وتسجيلات صوتية وغيرها، وهذه البيانات غالباً ما تكون معقدة بحيث يصعب تحليلها باستخدام وسيلة أو أداة واحدة فقط. وتتميز هذه البيانات بكونها ضخمة وبالتالي لا يمكن أن تتوفر في أجهزتنا الخاصة، بل يمكن أن تكون في منصات وسائل التواصل الاجتماعي مثلاً، أي أن موقعاً كفيسبوك أو تويتر، يمكن أن يتضمن بيانات ضخمة، كونه يحتوي على الملايين من الحسابات العائدة لأشخاص. ويجب أن تتوفر عدة عوامل لاعتبار البيانات ضخمة، أهمها الحجم وسرعة تدفقها وتنوعها، أي تكون أشكالها متنوعة بين الصور والأرقام والتسجيلات الصوتية وغيرها.
يعرِّف معهد ماكنزي البيانات الضخمة على أنها مجموعة من البيانات التي تمتلك حجماً يصعب تخزينه أو تحليله أو إدارته بواسطة أدوات قواعد البيانات التقليدية.
ويهدف علم البيانات الضخمة إلى تخزين البيانات ومعالجتها وتحليلها لإيجاد أنماطٍ فيها أو استخلاص المعلومات المفيدة منها.
تعد هادوب (Hadoop) من أفضل تقنيات التعامل مع البيانات الضخمة، وهي مكتبة مفتوحة المصدر مناسبة للتعامل مع البيانات الضخمة المتنوعة والسريعة، وتستخدم شركات كبرى خدمة هادوب، مثلاً هناك لينكد إن الشبكة الاجتماعية المتخصصة بالوظائف والعمل تستخدم الخدمة من أجل توليد أكثر من 100 مليار مقترح على المستخدمين أسبوعياً.
هناك علاقةٌ تبادلية بين الذكاء الاصطناعي والبيانات الضخمة؛ حيث إن خوارزميات الذكاء الاصطناعي تحتاج لأكبر قدرٍ ممكن من البيانات حتى تتدرب عليها، فكلما كانت بيانات التدريب أضخم كلما كان أداء الخوارزمية أفضل. وفي المقابل، فإن تقنيات الذكاء الاصطناعي تسمح بتحليلٍ أسرع وأعمق للبيانات الضخمة وتوفر طرقاً لاكتشاف الأنماط بشكلٍ كان صعباً للغاية وربما مستحيلاً من دونها.


مفاهيم من نفس المحور


مقالات تم ذكر هذا المصطلح فيها


بدعم من تقنيات