مختص في مجال تكنولوجيا المعلومات يكون عمله الأساسي تحضير البيانات للتحليل أو الاستخدام التشغيلي. يكون مهندس البيانات عادةً مسؤولاً عن بناء مسارات تدفق البيانات لجمع المعلومات من الأنظمة المختلفة التي تُشكل مصدراً لها. كما يقوم بدمج البيانات وتوحيدها وتنظيفها وهيكلتها لاستخدامها في تطبيقات التحليل. وبشكل عام يهدف إلى تسهيل الوصول إلى تلك البيانات وتعزيز أداء نظام البيانات الضخمة في المنظمة التي يعمل بها.
يركز مهندسو البيانات على جمع وتحضير البيانات ليتم استخدامها من قبل علماء البيانات والمحللين في الشركة. وقد يلعب مهندس البيانات واحداً من الأدوار الثلاثة التالية:
مهندس البيانات المختص بقواعد البيانات: يعمل هذا المهندس في الشركات الكبرى التي تكون بياناتها موزعة عبر العديد من قواعد البيانات. ويكون عادةً مسؤولاً عن إنشاء وصيانة وتعميم قواعد البيانات التحليلية. بالإضافة إلى التعامل مع خطوط التدفق والتحليل الفعال وإنشاء مخططات الجدول باستخدام عملية الاستخراج والتحويل والتحميل (ETL).