عبارة عن نظام يقوم بتجميع البيانات من مصادر مختلفة في مخزن بيانات مركزي متناسق لدعم عمليات تحليل وتنقيب البيانات وتطبيقات الذكاء الاصطناعي والتعلم الآلي. ظهر مفهوم مستودع البيانات منذ ثمانينيات القرن الماضي بهدف تمكين الشركات من إجراء عمليات تحليل عالية القدرة على أحجام هائلة من البيانات التاريخية. وذلك نظراً لعدم إمكانية إجراء تلك العمليات بالاعتماد على قواعد البيانات التقليدية.
وهو يُخزن كميات ضخمة من البيانات المهيكلة القادمة من أنظمة المعاملات وتطبيقات الأعمال. وفي السابق كانت هذه المستودعات تُستضاف محلياً على حاسوب مركزي، وتقتصر وظائفها على استخراج البيانات من مصادرها وتنظيفها وتحضيرها. ثم تخزين تلك البيانات وصيانتها في قواعد بيانات علائقية. أما اليوم فيمكن استضافة المستودع على جهاز مخصص أو في السحابة، ويقدم وظائف إضافية مثل قدرات التحليل وأدوات التمثيل المرئي للبيانات.
تتألف من ثلاث طبقات هي:
يمكن للمنظمات والشركات العاملة في مختلف القطاعات الاستفادة من مستودعات البيانات في تطبيق حلول ذكاء الأعمال (BI). فهذه المستودعات تضمن أن كافة البيانات التي يتم جمعها من مختلف المصادر متناسقة وذات صلة بالمجال المطلوب. وبالتالي تعزز جودة تلك البيانات المُستخدمة في عمليات التحليل؛ مما ينعكس بشكل إيجابي على نتائج التحليل ويحسن عمليات صنع القرار في كافة الجوانب، بدءاً من عمليات الأعمال وصولاً إلى الإدارة المالية وإدارة المخزون.
تُبنى قاعدة البيانات بشكل أساسي لإجراء الاستعلامات السريعة ومعالجة المعاملات وليس لأغراض التحليل. فهي تعتبر مخزن البيانات الخاص بتطبيق محدد فقط وتُركز على تحديث بياناتها في الزمن الحقيقي. بينما مستودع البيانات يخزن البيانات من أي عدد أو حتى من كافة تطبيقات الشركة، ويعزز البيانات الحالية والتاريخية لاستخدامها في عمليات التحليل التنبؤي والتعلم الآلي وغيرها من أنواع التحليل المتقدمة.