عبارة عن مخزن مركزي يسمح للمستخدم بتخزين كافة أنواع البيانات المهيكلة وغير المهيكلة بكميات كبيرة جداً وبصيغتها الأصلية لاستخدامها مستقبلاً عند الحاجة إليها. تعطى البيانات المخزنة في بحيرة البيانات محددات وبيانات وصفية ووسوم لسهولة استرجاعها. ويمكن تطبيق مختلف أنواع التحليل عليها؛ بدءاً من التمثيل المرئي وصولاً إلى معالجة البيانات الضخمة والتحليل في الزمن الحقيقي والتعلم الآلي، وذلك للمساعدة في اتخاذ قرارات أفضل.
تختلف بحيرة البيانات عن مستودع البيانات (Data Warehouse) في العديد من الجوانب، فمستودع البيانات عبارة عن قاعدة بيانات معززة لتحليل البيانات العلائقية القادمة من أنظمة المعاملات وتطبيقات الأعمال، وتُخزن فيه البيانات المهيكلة فقط ضمن ملفات ومجلدات بالاعتماد على بنية هرمية، وتستخدم من قبل محللي الأعمال؛ حيث يكون الهدف من تخزين تلك البيانات محدد مسبقاً.
أما بحيرة البيانات تُخزن البيانات العلائقية القادمة من تطبيقات الأعمال وغير العلائقية القادمة من تطبيقات الهواتف وأجهزة إنترنت الأشياء ومواقع الويب وشبكات التواصل الاجتماعي وغيرها بالاعتماد على بنية مسطحة، وتُستخدم من قبل علماء البيانات والمطورين ومحللي الأعمال فالهدف من تخزين البيانات فيها غير محدد مسبقاً.
تقدم فوائد عديدة أهمها: