ارائه انواع پایان نامه دانشجویی در وب سایت دانشجویاران http://daneshjooyaran.ir
داده کاوی، مفهوم ، تاریخچه و مراحل آن(DATA MINIG)
داده کاوی، مفهوم ، تاریخچه و مراحل آن(DATA MINIG)
پیشگفتاری برداده کاوی
داده کاوی یکی از پیشرفتهای اخیر در راستای فن آوریهای مدیریت داده هاست. داده کاوی مجموعه ای از فنون است که به شخص امکان میدهد تا ورای داده پردازی معمولی حرکت کند و به استخراج اطلاعاتی که در انبوه داده ها مخفی و یا پنهان است کمک می کند. انگیزه برای گسترش داده کاوی بطور عمده از دنیای تجارت در دهه ۱۹۹۰ پدید آمد. مثلا داده کاوی در حوزه بازاریابی، بدلیل پیوستگی غیرقابل انتظاری که بین پروفایل یک مشتری و الگوی خرید او ایجاد میکند اهمیتی خاص دارد.
مقدمه ای بر داده کاوی یا DATA MINIG
با گسترش فناوري اطلاعات و ارتباطات درجهان و ورود سريع آن به زندگي روزمره مردم مسائل و ضرورتهاي تازهاي بهوجودآمدهاست .امروزه انسان توسعه يافته كسي است كه به اطلاعات دسترسي داشتهباشد و دسترسي به اطلاعات نه يك ضرورت،كه يك قدرت محسوبميشود.
دراينميان شهرها به عنوان مراكز قدرت انساني و تمدنهاي بشري بيش از پيش اهميتيافتهاند. به اعتقاد الوين تافلر، مردم كره زمين تا به امروز سه موج اساسي تحول راپشت سرگذاشته اند :
موج اول، موج انقلاب كشاوزي است كه زمان آغاز آن بركسي مشخص نيست.
موج دوم، انقلاب صنعتي است كه به دنبال اختراع ماشين بخار در سال ۱۷۶۴آغاز شد.
موج سوم يا انقلاب انفورماتيك است كه ازسال ۱۹۴۶ كه بشر به ساخت كامپيوتر نائل آمده آغاز گشته است.
اگر در موج دوم سختافزارها به كمك انسانها ميآمدند، درموج سوم اين نرمافزارها هستند که به خدمت بشر ميشتابند و تفكرات و تصورات آدمي را به شكل كدهاي صفر و يك و با كمك امواج ماهوارهاي مبادله ميكنند.
در موج سوم، انسان هر روز که بيشتر ياد ميگيرد، بيشترمي فهمدكه با حقيقت فاصله دارد .موج سوم راموج خردورزي نيز لقب داده اند زيرا در اين عرصهها، انسانها ديگر فرصت ندارند زياد با هم صحبتكنند، همه چيز تعريفشده و براي هر تعريف، يك كد درنظرگرفتهشدهاست.
از سوی دیگر در دنیای به شدت رقابتی امروز، اطلاعات بعنوان یکی از فاکتورهای تولیدی مهم پدیدار شده است. در نتیجه تلاش برای استخراج اطلاعات از داده ها توجه بسیاری از افراد دخیل در صنعت اطلاعات و حوزه های وابسته را به خود جلب نموده است.
حجم بالای داده های دائما در حال رشد در همه حوزه ها و نیز تنوع آنها به شکل داده متنی، اعداد، گرافیکها، نقشه ها، عکسها، تصاویر ماهواره ای و عکسهای گرفته شده با اشعه ایکس نمایانگر پیچیدگی کار تبدیل داده ها به اطلاعات است.
علاوه بر این، تفاوت وسیع در فرآیندهای تولید داده مثل روش آنالوگ مبتنی بر کاغذ و روش دیجیتالی مبتنی بر کامپیوتر، مزید بر علت شده است. استراتژیها و فنون متعددی برای گردآوری، ذخیره، سازماندهی و مدیریت کارآمد داده های موجود و رسیدن به نتایج معنی دار بکار گرفته شده اند. بعلاوه، عملکرد مناسب ابرداده که داده ای درباره داده است در عمل عالی بنظر میرسد.
پیشرفتهای حاصله در علم اطلاع رسانی و تکنولوژی اطلاعات، فنون و ابزارهای جدیدی برای غلبه بر رشد مستمر و تنوع بانکهای اطلاعاتی تامین می کنند. این پیشرفتها هم در بعد سخت افزاری و هم نرم افزاری حاصل شده اند.
ریزپردازنده های سریع، ابزارهای ذخیره داده های انبوه پیوسته و غیر پیوسته، اسکنرها، چاپگرها و دیگر ابزارهای جانبی نمایانگر پیشرفتهای حوزه سخت افزار هستند. پیشرفتهای حاصل در نظامهای مدیریت بانک اطلاعات در طی چهار دهه گذشته نمایانگر تلاشهای بخش نرم افزاری است.
این تلاشها در بخش نرم افزار را میتوان بعنوان یک حرکت پیشرونده از ایجاد یک بانک اطلاعات ساده تا شبکه ها و بانکهای اطلاعاتی رابطه ای و سلسله مراتبی برای پاسخگویی به نیاز روزافزون سازماندهی و بازیابی اطلاعات ملاحظه نمود. بدین منظور در هر دوره، نظامهای مدیریت بانک اطلاعاتی مناسب سازگار با نرم افزار سیستم عامل و سخت افزار رایج گسترش یافته اند. در این رابطه میتوان از محصولاتی مانند، Dbase-IV, Unify, Sybase, Oracle و غیره نام برد.
داده کاوی یکی از پیشرفتهای اخیر در راستای فن آوریهای مدیریت داده هاست. داده کاوی مجموعه ای از فنون است که به شخص امکان میدهد تا ورای داده پردازی معمولی حرکت کند و به استخراج اطلاعاتی که در انبوه داده ها مخفی و یا پنهان است کمک می کند. انگیزه برای گسترش داده کاوی بطور عمده از دنیای تجارت در دهه ۱۹۹۰ پدید آمد. مثلا داده کاوی در حوزه بازاریابی، بدلیل پیوستگی غیرقابل انتظاری که بین پروفایل یک مشتری و الگوی خرید او ایجاد میکند اهمیتی خاص دارد.
تحلیل رکوردهای حجیم نگهداری سخت افزارهای صنعتی، داده های هواشناسی و دیدن کانال های تلوزیونی از دیگر کاربردهای آن است. در حوزه مدیریت کتابخانه کاربرد داده کاوی بعنوان فرایند ماخذ کاوی نامگذاری شده است. این مقاله به کاربردهای داده کاوی در مدیریت کتابخانه ها و موسسات آموزشی می پردازد. در ابتدا به چند سیستم سازماندهی داده ها که ارتباط نزدیکی به داده کاوی دارند می پردازد؛ سپس عناصر داده ای توصیف میشوند و درپایان چگونگی بکارگیری داده کاوی در کتابخانه ها و موسسات آموزشی مورد بحث قرار گرفته و مسائل عملی مرتبط در نظر گرفته می شوند.
مفاهیم داده کاوی
مفهوم مديريت ذخيره سازی و دستيابی اطلاعات
داده های اطلاعاتی به عنوان يکی از منابع حياتی سازمان شناخته می شود و بسياری از سازمان ها با اطلاعات و دانش سازمانی خود مانند ساير دارايی های ارزشمندشان برخورد می کنند .
نکته: داده اطلاعاتی (Data) به اطلاعات خام سازمان اتلاق میشود و اطلاعات (Information) به دادههای پردازش شده. همچنين داده های پردازش شده پس از طبقه بندی و آناليز به دانش سازمان (Knowledge) تبديل می گردند.
آنالیز داده ها
حال تصور نماييد، دسترسی به اطلاعات (Information) در شرايطی که دادهها به روش نامناسبی نگهداری شوند و يا روش ضابطه مندی جهت دستيابی به آنها وجود نداشته باشد تا چه حد مشکل است . برای رسيدن به يک سيستم اطلاعاتی مناسب، دادهها می بايست به صورتی منطقی طبقه بندی و ذخيره شوند تا استفاده از آن ها سادهتر بوده، با کارايی بيشتری تحليل شوند و سريعتر مورد استفاده قرار گيرند و در نتيجه مديريت بهتری بر آن ها اعمال شود.
?مثلت داده
ساختار بانک اطلاعاتی سازمان:
داده های سازمان ها در انواع بانک های اطلاعاتی و با ساختارهای متنوعی ذخيره میگردند . طراحی و سازماندهی اين ساختارها، بکارگيری و انتقال به بانکهای اطلاعاتی پيشرفته و بهينه سازی آن ها يکی خدماتی است که توسط واحدهای فناوری اطلاعات ارايه می شود .
ساختار بانک اطلاعاتی
داده کاوی (Data Mining):
فناوريهاي نوين اطلاعاتي و ارتباطي، و همچنين تكنولوژيهاي پشتيبان تصميم، با جمعآوري، ذخيره، ارزيابي، تفسير و تحليل، بازيابي و اشاعه اطلاعات و دانش به كاربران خاص، ميتوانند در اطلاع يابي به موقع، صحيح و موردنياز به افراد تاثير زيادي داشته باشند. يكي از ابزارهاي مورد استفاده در اين فناوريها، داده كاوي مي باشد. دادهکاوي شامل استفاده از ابزارهاي پيشرفته تحليل داده به منظور کشف الگوهاي معتبر، از قبل ناشناخته و روابط در مجموعه داده هاي بزرگ است. اين ابزارها، مدلهاي آماري، الگوريتمهاي رياضي و متدهاي يادگيري ماشين (الگوريتمهايي که عملکرد خود را از طريق تجربه بهصورت اتوماتيک بهبود ميدهند) ميباشد. داده کاوي فراتر از جمعآوري و مديريت داده است، و شامل تجزيه و تحليل و پيشگويي ميشود. نام ديگر آن کشف دانش در پايگاه داده يا به اختصار KDDاست .
مراحل داده کاوی
دادهکاوي ميتواند روي دادههاي کمي، متني، يا چندرسانهاي انجامگيرد. کاربردهاي آن شامل موارد زير ميباشد :
– قوانين وابستگي: الگوهايي که در آن وجود يك آيتم دلالت بر وجود آيتم ديگر دارد،
– کلاسبندي: انتساب الگوها به يک مجموعه کوچک از کلاسهاي از قبل تعريف شده به وسيله کشف بعضي روابط بين ويژگيها،
– خوشهبندي: گروهبندي مشتريان يا مجموعه الگوهايي که ويژگيهاي مشابهي دارند،
– پيشگويي: کشف الگوها براي پيشگويي منطقي درباره آينده،
– تحليل مسير:يا الگوهاي ترتيبي: الگوهايي که در آن يک رخداد منجر به وقوع رخداد ديگر ميشود.
دادهکاوي يک تکنولوژي جديد نيست ولي کاربرد آن بهطور معناداري در بخشهاي مختلف خصوصي و عمومي روبهرشد بوده و عموما صنايعي چون بانک، بيمه، پزشکي و خردهفروشي از دادهکاوي به هدف کاهش هزينهها، افزايش تحقيقات و افزايش فروش استفاده ميکنند.
مفاهيم پايه در داده کاوي
در داده کاوي معمولا به کشف الگوهاي مفيد از ميان داده ها اشاره مي شود . منظور از الگوي مفيد ، مدلي در داده ها است که ارتباط ميان يک زير مجموعه از داده ها را توصيف مي کند و معتبر ، ساده ، قابل فهم و جديد است .
تعريف داده کاوي
در متون آکادميک تعاريف گوناگوني براي داده کاوي ارائه شده است . در برخي از اين تعاريف داده کاوي در حد ابزاري که کاربران را قادر به ارتباط مستقيم با حجم عظيم داده ها مي سازد معرفي گرديده است و در برخي ديگر ، تعاريف دقيقتر که درآنها به کاوش در داده ها توجه مي شود موجود است .
برخي از اين تعاريف عبارتند از :
داده کاوي عبارت است از فرايند استخراج اطلاعات معتبر ، از پيش ناشناخته ، قابل فهم و قابل اعتماد از پايگاه داده هاي بزرگ و استفاده از آن در تصميم گيري در فعاليت هاي تجاري مهم.
اصطلاح داده کاوي به فرايند نيم خودکار تجزيه و تحليل پايگاه داده هاي بزرگ به منظور يافتن الگوهاي مفيد اطلاق مي شود
داده کاوي يعني جستجو در يک پايگاه داده ها براي يافتن الگوهايي ميان داده ها .
داده کاوي يعني استخراج دانش کلان ، قابل استناد و جديد از پايگاه داده ها ي بزرگ .
داده کاوي يعني تجزيه و تحليل مجموعه داده هاي قابل مشاهده براي يافتن روابط مطمئن بين داده ها .
همانگونه که در تعاريف گوناگون داده کاوي مشاهده مي شود ، تقريبا در تمامي تعاريف به مفاهيمي چون استخراج دانش ، تحليل و يافتن الگوي بين داده ها اشاره شده است .
برای مشاهده فهرست مطالب این پایان نامه و خرید آن بر روی
لینک زیر کلیک کنید
مشاهده و دانلود پایان نامه داده کاوی
مطلبی دیگر از این انتشارات
معرفی ابزار Apache Flink
مطلبی دیگر از این انتشارات
آنالیز رسانه های اجتماعی
مطلبی دیگر از این انتشارات
هوش تصویری چیست؟+تست