انبار داده (Data Warehouse) سیستمی است که برای گزارش گیری و تجزیه و تحلیل دادهها استفاده میشود. DWها مخازن مرکزی دادههای یک یا چند منبع متفاوت هستند و تمام اطلاعات جدید و قدیمی را در یک مکان ذخیره میکنند. انبارداده (DW) فرآیند جمعآوری و مدیریت دادهها از منابع مختلف به منظور ارائه یک بینش تجاری است و معمولا برای اتصال و تجزیه و تحلیل دادههای تجاری از منابع مختلف استفاده میکند. انبار داده هسته سیستم هوش تجاری BI است که اختصاصا برای تجزیه و تحلیل دادهها ساخته شده است. در این مقاله به معرفی مفهوم پایگاه داده میپردازیم و به انواع مختلف آن اشاره میکنیم.
تعریف دقیق انبار داده
انبار داده نوعی سیستم مدیریت داده میباشد که برای پشتیبانی از فعالیتهای هوش تجاری (BI) به ویژه تجزیه و تحلیل داده طراحی شده است. پایگاه داده مقادیر زیادی از دادهها را از منابع متعدد و یکپارچه جمع آوری میکند. قابلیتهای تحلیلی این پایگاه به سازمانها اجازه میدهد تا ایدههای ارزشمند تجاری را از دادهها استخراج کنند و براساس آن تصمیمگیری بهتری داشته باشند. پایگاه داده به مرور زمان یک رکورد تاریخی ایجاد میکند که این دستاورد برای دانشمندان داده و تحلیلگران تجاری بسیار ارزشمند است. با وجود این قابلیتها، یک پایگاه داده را میتوان «منبع واحد حقیقت» یک سازمان در نظر گرفت.
انبار داده چگونه کار میکند؟
پایگاه داده به عنوان یک مخزن مرکزی کار میکند که اطلاعات آن از یک یا چند منبع داده انتقال داده میشود. دادهها، پردازش، تبدیل و جذب میشوند تا کاربران بتوانند از طریق ابزارهای هوش تجاری، مشتریان SQL و صفحات گسترده به دادههای پردازش شده در Data Warehouse دسترسی داشته باشند. یک انبار داده اطلاعاتی را که از منابع مختلف به دست میآورد در یک پایگاه داده جامع ادغام میکند.
سازمانها با داشتن تمام اطلاعات در یک مکان میتوانند مشتریان خود را به صورت جامع تجزیه و تحلیل کنند. انبار داده تمام اطلاعات موجود را برای تجزیه و تحلیل فراهم میکند تا از این طریق داده کاوی امکانپذیر شود. مفهوم داده کاوی به فروش و سود بیشتر منجر شود.
یک انبار داده ممکن است چندین پایگاه داده داشته باشد. دادهها در هر پایگاه به جداول و ستونهای مختلف تقسیم میشوند و در هر ستون توضیحاتی از دادهها مانند: تعداد یا فیلد آنها قابل مشاهده است. این جداول در پوشهها قرار میگیرند تا دادهها در آنها ذخیره شوند. سپس ابزارهای پرس و جو با استفاده از طرحواره تعیین میکنند به کدام جدول داده دسترسی داشته باشند تا تجزیه و تحلیل دادهها انجام شود.
انواع اصلی انبار داده
انبار داده سازمانی (EDW)
پایگاه داده سازمانی (EDW) یک انبار متمرکز است. این انبار وظیفه خدمات پشتیبانی و تصمیم گیری نهایی را برعهده دارد و یک رویکرد واحد برای سازماندهی و نمایش دادهها ارائه میدهد.
ذخیره اطلاعات عملیاتی
زمانی که دیگر سیستمهای OLTP از نیازهای ذخیره سازی سازمان پشتیبانی نمیکنند، پایگاه داده برای ذخیره دادههای مورد نیاز استفاده میشود. انبار داده در ODS به صورت خودکار به روز رسانی میشود، بنابراین به طور گسترده برای کارهایی مانند ذخیره سوابق کارمندان استفاده میشود.
Data Mart
دیتا مارت زیرمجموعهای از پایگاه داده است و برای یک خط خاص از کسب و کار، مانند فروش، امور مالی، فروش یا امور مالی طراحی شده است. در دیتا مارت دادههای مستقل مستقیما از منابع جمعآوری کرد.
معماری انبار داده چگونه است؟
معماری پایگاه داده از لایههای مختلف تشکیل شده است. لایه بالایی مشتری است که نتایج را از طریق گزارش، تجزیه و تحلیل و ابزارهای داده کاوی ارائه میدهد. و لایه میانی شامل موتور تجزیه و تحلیل است که برای دسترسی و تجزیه و تحلیل دادهها استفاده میشود. لایه پایینی سرور پایگاه داده است؛ جایی که دادهها بارگیری و ذخیره میشوند. اما چه کسانی به انبار داده نیاز دارند؟
کاربرانی که از فرآیندهای پیچیده برای به دست آوردن اطلاعات از چندین منبع داده استفاده میکنند. پایگاه داده برای افرادی که به دنبال یک رویکرد سیستماتیک برای تصمیم گیری هستند ضروری است. اگر عملکرد سریع در حجم عظیمی از دادهها را بخواهید، پایگاه داده برای گزارشها، شبکهها یا نمودارهای ضروری بسیار مفید خواهد بود.
برخی از ویژگیهای انبار داده
ابزارهای دسترسی برای کاربر نهایی به پنج گروه مختلف تقسیم شدهاند: گزارش داده، ابزار پرس و جو، ابزار توسعه برنامه، ابزار EIS، ابزار OLAP و ابزارهای داده کاوی. به طور کلی یک انبار داده شامل ویژگیهای زیر است:
ذخیره و مدیریت دادهها
استخراج، بارگذاری و تبدیل (ELT) برای آماده سازی دادهها و قابلیتهای تجزیه و تحلیل آماری و داده کاوی
ابزارهای تجزیه و تحلیل مشتری برای ارائه دادهها به کاربران تجاری
تصمیم گیری برای سازمانهای بزرگ
دادههای تلفیقی از منابع مختلف
تجزیه و تحلیل دادههای قدیمی
کیفیت، سازگاری و دقت در جمع آوری و تجزیه و تحلیل دادهها
سایر برنامههای تحلیلی اطلاعات علمی را با استفاده از علم داده و الگوریتمهای هوش مصنوعی (AI) یا نمودارها تولید میکنند. به همین ترتیب انواع بیشتری از تجزیه و تحلیل دادهها امکان پذیر میشود.
انبار داده چه مزیتهایی دارد؟
پایگاه داده مزیتهای منحصر به فردی را ارائه میدهد و سازمان ها با استفاده از این مزایا میتوانند حجم زیادی از دادههای مختلف را تجزیه و تحلیل کنند. بنابراین ارزش افزوده ای که از دادهها استخراج میشود بی نهایت خواهد بود. انبار داده همچنین سابقه تاریخی تمام دادهها را نگهداری میکند؛ حتی اگر داده جدیدی را اضافه کنید بازهم دادههای قبلی در جای خود قرار دارند.
موضوع محور: آنها میتوانند دادههای مربوط به یک موضوع خاص یا یک حوزه (مانند فروش) را تجزیه و تحلیل کنند.
یکپارچه سازی: انبارهای داده بین انواع دادههای مختلف از منابع متفاوت سازگاری ایجاد میکنند.
متغیر با زمان: یک انبار داده که به خوبی طراحی شده باشد، پرس و جوها را به سرعت انجام داده و توان عملیاتی بالایی را ارائه میدهد. علاوه بر اینها، این فناوری برای کاربران نهایی انعطاف کافی فراهم میکند تا بتوانند حجم عظیمی از دادهها را برای پاسخگویی دقیقتر بررسی کنند. پایگاه داده به عنوان پایهای کاربردی برای محیطهای میانافزار BI عمل میکند که گزارشها و سایر رابطها را در اختیار کاربران نهایی قرار میدهد.
انبار داده مدرن چیست؟
توجه نمایید که پایگاه داده بخشی از فناوری اطلاعات، مهندسی داده، تجزیه و تحلیل تجاری و علم داده میباشد. کاربران مختلف در سازمانهای بزرگ و کوچک نیازهای متفاوتی به انبار داده دارند. معماری داده مدرن با ارائه راهی برای مدیریت انواع دادهها و تجزیه و تحلیل آنها به نیازهای مختلف پاسخ میدهد. الگوهای معماری برای کار در راستای بهترین استراتژی های صنعتی طراحی شدهاند. انبار داده مدرن شامل یک پایگاه داده است که مدیریت انواع دادهها را سادهتر میکند و راههای مختلفی را برای استفاده از آنها ارائه میدهد. این پایگاه داده مدرن از SQL و یادگیری ماشین پشتیبانی میکند.
انبار داده مدرن میتواند جریان کار دادهها را بهگونهای ساده کند که انبارهای دیگر هرگز نمیتوانند این کار را انجام دهند. این بدان معناست که همه، از تحلیلگران و مهندسان داده گرفته تا دانشمندان داده و تیمهای فناوری اطلاعات میتوانند کارایی موثرتری داشته باشند.
نتیجه گیری
کاربران تجاری برای استخراج اطلاعات از دادههای خود و نظارت بر عملکرد کسب و کار خود به این ابزارهای تحلیلی متکی هستند. انبار داده یک مخزن مرکزی اطلاعات است که برای تصمیم گیری آگاهانهتر و تجزیه و تحلیل دادهها استفاده میشود. پایگاه داده (Data Warehouse) جدا از پایگاه داده عملیاتی سازمان نگهداری میشود. این انبار داده یک محصول نیست، بلکه یک محیط است. این محیط یک ساختار معماری از سیستم اطلاعاتی است که اطلاعات پشتیبانی تصمیم گیری جدید و قدیمی را در اختیار کاربران قرار میدهد.