معرفی کامل Data warehouse و اهمیت آن

Data warehouse از دسته ابزارهای بسیار مهم و قدرتمند در عصر امروز محسوب می شود. وجود Data warehouse سبب می شود که عملکرد شرکت های بزرگ بهتر شود.

 معرفی کامل Data warehouse و اهمیت آن

وقتی صبحت از Data warehouse می شود در واقع می خواهیم در خصوص انبار داده ها صحبت کنیم. در این مقاله در ابتدا سعی می کنیم تعاریف مختلف در خصوص این گزینه را مورد بررسی قرار دهیم سپس شرایطی فراهم می شود تا بتوانیم این موضوع مهم را از نظر کاربرد نیز مورد تایید قرار دهیم. اهمیت Data warehouse در تکنولوژی بسیار زیاد است به طوری که بسیاری از شرکت های بزرگ بدون داشتن انبار داده ای صحیح در عمل دچار مشکل شده و مختل می شوند.

تعریف Data warehouse از دید rahph

رالف تعریف واضحی از Data warehouse دارد، او می گوید که Data warehouse نسخه ای از داده های تراکنشی است به طوری که سازماندهی آن ها به صورت اختصاصی برای پرس و جوها و همین طور گزارش دهی فراهم شده است. با گذر زمان به این تعریف 2 ایراد وارد شده است: در وهله اول باید بدانیم که گاها داده هایی که در یک Data warehouse ذخیره می شود تراکنشی نیستند و به اصطلاح صحیح تر غیر تراکنشی هستند! بنابراین وجود کلمه تراکنشی در این تعریف نمی تواند یک اصل باشد! مورد بعدی در خصوص خروجی اصلی سیستم های Data warehouse است، به طوری که لیست گیری های فهرست وار در حجم کم دیده می شوند در صورتی که وقتی صحبت از گزارش گیری های اداری است در واقع به حجم زیادی از داده ها اشاره می شود! به راستی تعریف صحیح از انبار داده چیست؟ با ما همراه باشید.

 

تاریخچه Data warehouse

می دانیم که سیستم های کامپیوتری در دهه های گذشته پیشرفت های زیادی کرده اند. در سال 1960 mainframe ها اهمیت زیادی داشتند و پس از گذشت 10 سال mini computer ها به بازار آمدند و از دهه 1990 با پدیده ارزشمند server/client آشنا شدیم. در این بین یک واقعیت بسیار مهم وجود دارد به این صورت که بیشتر برنامه های تجاری هنوز هم بر روی mainframe ها سوار هستند و به اصطلاح اجرا می شوند. در بررسی های اخیر یک تخمین در این خصوص وجود دارد به این ترتیب که بیش از 70 درصد از اطلاعات سازمان های مختلف بر روی mainframe ها قرار دارد. شاید یکی از دلایل آن به این شکل باشد که این سیستم ها آنقدر پیشرفت داشته اند که انتقال آن ها به یک محیط جدید بسیار هزینه بر و مشکل است.

اگر به زمان های گذشته نگاهی بیندازیم می بینیم که بسیاری از سیستم های پایگاه داده ای برای پردازش های داده های عملیاتی بوده است. اگر بخواهیم یک تعریف ساده از داده های عملیاتی داشته باشیم به این شکل است که داده های عملیاتی به مجموعه ای از داده ها گفته می شود که در یک سازمان در لاین کارهای روزانه قرار دارد. چنین داده هایی در پایگاه های داده ای ذخیره می شوند و دستیابی به آن ها توسط سیستم های OLTP انجام می شود.

Data warehouse در دهه 1970

در دهه 1970 فردی که اسم وی به اختصار CODD است یک مدل رابطه ای برای پایگاه های داده ای معرفی کرده است که کاربر بتواند به صورت مستقیم با استفاده از Data warehouse به داده ها دسترسی داشته باشد. مجموعه داده هایی که در سازمان ها استفاده می شود در طول زمان های گذشته با سرعت افزایش می یابد، به این ترتیب در سال 1980 سازمان های بزرگ با یک سری از داده هایی در محدوده PETABYTE کار می کردند. هرچه حجم داده های موجود افزایش یابد نیاز به روش های آنالیز قابل لمس تر و به اصطلاح پیشرفته تر خواهد بود. سازمان ها تصمیم گرفتند که تعداد و نوع سیستم هایی را که به کار می بردند افزایش دهند به این ترتیب در یک سازمان هر یک از واحدهای سازمان برای خود دارای یک سیستم جداگانه برای ذخیره اطلاع شدند. به این ترتیب Data warehouse اهمیت خاصی پیدا کرد و برای دسترسی به آن نیاز به برنامه های کاربردی خاصی بود.

علت اهمیت Data warehouse

یکی از ویژگی های بسیار مهم داده های موضع گرا بودن است! مبرهن است که هر موضوع یکی از فعالیت های سازمان را بیان می کند و به نوعی اهداف سازمان بر اساس آن شکل می گیرد. موضوعی به نام OLAP وجود دارد که اجازه آنالیز سریع و موثر را بر روی انبوهی از داده می دهد در این صورت است که Data warehouse وارد مدل های چند بعدی شده است و کاربر می تواند بسیار سریع تر و همین طور آسان تر به داده های خلاصه شده دسترسی داشته باشد.

از طرف دیگر یک سری سیستم های پردازش تراکنش بر خط و یا OLTP نیز دیده می شود که مبتنی بر اعمال روزانه است، مثالی که برای این گزینه می توان زد. سیستم های تراکنشی بانکی است. در چنین سیستم هایی تراکنش ها درخواست خواندن داده ها و همین طور به روز رسانی داده ها را برعهده دارد. موضوع دیگری که در خصوص انبار داده دیده می شود وجود مکانیزم های کنترل همروندی و همین طور ریکاوری داده است. اما باید بدانیم که وظیفه اصلی سیستم های Data warehouse فرآیند تصمیم سازی است. در سیستم های Data warehouse عموما شاهد تاریخچه ای از داده ها به صورت خلاصه شده هستیم و هدف اصلی یکپارچگی برای دسترسی آسان تر است.

جمع بندی

به طور دقیق پردازش های تراکنش بر خط درانبار داده رابطه ای جایگاهی مشخص دارند و سیستم های پردازش تحلیل در Data warehouse تحلیلی جانمایی خواهند شد.

دانلود نسخه ی PDF این مطلب