سلام دوست عزیز وارد حساب کاربری خود شوید
داده كاوي عبارت است از فرآيند خودكار کشف دانش و اطلاعات از پايگاه هاي داد ه اي.
اين فرآيند تكنيك ها يي از هوش مصنوعي را بر روي مقادير زيادي داده اعمال مي كند تا روندها , الگوها و روابط مخفي را كشف كند. ابزار هاي داده كاوي براي كشف دانش يا اطلاعات از داده ها به كاربراتكا نمي كنند، بلكه فرآيند پيشگويي واقعيت ها را خود كار مي سازند. اين تكنولوژي نوظهور، اخيرًا به طورفزايند هاي در تحليل ها مورد استفاده قرار مي گيرد.
كلمات كليدي :
Data mining, Predictive data mining, Exploration data analysis,
Data warehousing, Olap, neural network, Deployment , machine
Learning, Meta-learning, Bagging , Boosting , clustering , Eda
Drill-down analysis, Stacket generalization , classification
امروزه با حجم عظيمي از داده ها روبرو هستيم. براي استفاده از آنها به ابزارهاي كشف دانش نياز داريم. داده كاوي به عنوان يك توانايي پيشرفته در تحليل داده و كشف دانش مورد استفاده قرار مي گيرد. داده كاوي در علوم (ستاره شناسي،…)در تجارت (تبليغات، مديريت ارتباط با مشتري،…) در وب (موتورهاي جستجو،…) در مسايل دولتي (فعاليتهاي ضد تروريستي،…) كاربرد دارد. عبارت داده كاوي شباهت به استخراج زغال سنگ و طلا دارد. داده كاوي نيز اطلاعات را كه در انبارهاي داده مدفون شده است، استخراج مي كند.
در واقع هـــــدف از داده كاوي ايجاد مدل هايي براي تصميم گيري است. اين مدلها رفتارهاي آينده را براساس تحليلهاي گذشته پيش بيني مي كنند. به كاربردن داده كاوي به عنوان اهرمي براي آماده سازي داده ها و تكميل قابليتهاي انباره داده ، بهترين موقعيت را براي به دست آوردن برتريهاي رقابتي ايجاد مي كند.
داده كاوي (Data mining) يك فرايند تحليلي است كه جهت كاوش داده ها (معمولاً حجم بالاي داده ها و يا داده هاي تجاري و مربوط به بازار) و جستجوي الگوهاي پايدار يا روابط سيستماتيك مابين متغيرها بكار ميرود وسپس با اعمال الكو هاي شناسايي شده به زير مجمو عه هاي جديد صحت داده هاي بدست آمده بررسي ميگردد. هدف نهايي داده كاوي پيشگويي است.
سازما نها معمو ً لا روزانه مقدار زيادي داده را در انجام عمليات تجاري خود توليد و جمع آوري مي كنند.
امروزه براي اين پايگاه هاي داده شركتي عجيب نيست كه مقدار داده هاي آن در حد ترابايت باشد. با اين حال علي رغم ثروت اطلاعاتي عظيم ذخيره شده حدس زده مي شود كه فقط ٪ ٧كل داد ه هايي كه جمع آوري مي شود مورد استفاده قرار مي گيرد. بدين ترتيب مقدار قابل توجهي داده كه بدون شك حاوي اطلاعات ارزشمند سازماني است تا حد زيادي دست نخورده باقي مي ماند. در محيط تجاري عصر اطلاعات، كه هر روز رقابتي تر مي شود مي توان با استخراج اطلاعات از داد ه هاي استفاده نشده به تصميم گيري هاي استراتژيك دست يافت. در طول تاريخ تحليل داده ها از طريق رگرسيون و ديگر تكنيك هاي آماري انجام شده است. براي استفاده از اين تكنيكها ، لازم است كه تحليل گر مدلي خلق كند و فرآيند گر دآوري دانش را سازمان دهد.
اما امروزه اين روش ها به تنهايي كافي نيستند و بايد از روش ها ي خود كار استفاده كرد.
داده كاوي عبارت است از فرآيند خودكار کشف دانش و اطلاعات از پايگاه هاي داد ه اي.
اين فرآيند تكنيك ها يي از هوش مصنوعي را بر روي مقادير زيادي داده اعمال مي كند تا روندها ، الگوها و روابط مخفي را كشف كند. ابزار هاي داده كاوي براي كشف دانش يا اطلاعات از داده ها به كاربر اتكا نمي كنند، بلكه فرآيند پيشگويي واقعيت ها را خود كار مي سازند. اين تكنولوژي نوظهور، اخيرًا به طور
فرايند هاي در تحليل ها مورد استفاده قرار مي گيرد

داده كاوي پيشگويانه رايج ترين نوع داده كاوي است و با برنامه هاي كاربردي تجاري در ارتباط مستقيم است . فرايند داده كاوي از سه مرحله تشكيل شده است.
۱- كاوش اوليه (initial exploration )
۲-ساختن مدل يا شناسايي الگو بوسيلة سنجيدن اعتبار وصحت داده ها
۳-گسترش
چكيده : ۵
مقدمه : ۷
داده كاوي (Data mining) : ۸
مرحله كاوش(Exploration) : ۱۰
ساختن مدل و معتبر سازي (model building and validation): ۱۱
مرحلهُ گسترش Deployment):( : ۱۱
مفاهيم تعيين كننده در داده كاوي: ۱۳
تهيه مقدمات جهت داده كاوي : ۲۰
كاهش داده ها در داده كاوي: ۲۰
گسترش داده كاوي Deployment : ۲۱
آناليز (Drill – down analysis) : ۲۱
انتخاب خصيصه ها (Feature selection) : ۲۲
فراگيري ماشين (Machine learning): ۲۳
Meta-learning (فراگيري غير نمادين) : ۲۴
مدل هاي داده كاوي: ۲۵
فرايند داده كاوي در مديريت ارتباط با مشتري : ۲۸
داده كاوي پيشگويانه (Predictive data mining) : ۲۹
تعميم پشته اي (stacked generalization) .: ۳۰
متن كاوي (text mining) : ۳۱
انبار داده ها (Data Warehousing ) : ۳۲
مشخصات انبار داده ها : ۳۳
سيستم هاي انبار داده : ۳۵
معماري هاي انبار داده : ۳۶
معماري سه لايه دولين : ۳۸
OLAP (فرآيند آناليز آن لاين) Online analytic processing: ۳۹
تحليل كاوشگرايانة دادهها: ۴۰
تكنيكهاي محاسباتي EDA: : ۴۱
روشهاي كاوشگرايانة پايه: ۴۱
تكنيكهاي كاوشگرايانه چند متغيره: ۴۲
تكنيكهاي گرافيكي EDA: ۴۲
Brushing: ۴۲
تفكيكهاي گرافيكي ديگر EDA: : ۴۳
بررسي صحت نتايج EDA: ۴۴
شبكههاي عصبي: ۴۴
نتيجه گيري : ۴۸
مراجع : ۴۹