پاورپوینت ترفندهای داده کاوی (pptx) 21 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 21 اسلاید
قسمتی از متن PowerPoint (.pptx) :
ترفندهای داده
کاوی
تکنيکهای داده کاوی رايج
آناليز سبد بازاری
Market Basket Analysis
استنتاج مبتنی بر حافظه
Memory based reasoning
روشهای آماری، خوشه بندی و دسته بندی
درختهای تصميم گيری
Decision tree
روشهای مبتنی برگراف،
Link Analysis
شبکه های عصبی
الگوريتمهای ژنتيک
برای هر تکنيک ممکن است الگوريتمهای زيادی موجود باشد.
يادگيری بانظارت
يک فرآيند دو مرحله ای است:
ساختن يک مدل يادگيری با استفاده از نمونه های داده ای آموزشی موجود
استفاده از مدل ساخته شده برای مشخص کردن خروجی برای داده های تست
يادگيری بانظارت، يک مثال برای
credit card promotion
Table 2.3
•
The Credit Card Promotion Database
Income
Magazine
Watch
Life Insurance
Credit Card
Range ($)
Promotion
Promotion
Promotion
Insurance
Sex
Age
40–50K
Yes
No
No
No
Male
45
30–40K
Yes
Yes
Yes
No
Female
40
40–50K
No
No
No
No
Male
42
30–40K
Yes
Yes
Yes
Yes
Male
43
50–60K
Yes
No
Yes
No
Female
38
20–30K
No
No
No
No
Female
55
30–40K
Yes
No
Yes
Yes
Male
35
20–30K
No
Yes
No
No
Male
27
30–40K
Yes
No
No
No
Male
43
30–40K
Yes
Yes
Yes
No
Female
41
40–50K
No
Yes
Yes
No
Female
43
20–30K
No
Yes
Yes
No
Male
29
50–60K
Yes
Yes
Yes
No
Female
39
40–50K
No
Yes
No
No
Male
55
20–30K
No
No
Yes
Yes
Female
19
يادگيری بانظارت، يک مثال برای
credit card promotion
(ادامه)
يک
hypothesis
برای پايگاه داده اسلايد قبل:
ترکيب يک يا بيشتر از فيلدها برای دسته بندی کردن افرادی که از ارتقاء بيمه عمر استفاده
می کنند و آنها که استفاده نمی کنند.
يک قاعده برای دسته بندی کردن افراد می تواند بصورت زير باشد:
IF
Sex = Female & 19 <=Age <= 43
THEN
Life Insurance Promotion = Yes
دسته بندی
Classification
تخصيص شئ های آموزشی به کلاسهای گسسته از قبل مشخص شده
از نظر تکنيکی يعنی : بروز کردن فيلد دسته بندی هر رکورد با يک کد کلاس
اين عمليات نيازمند موارد زير است:
کلاسهايی با تعريف مناسب
well-defined
روالها، سيستمها و پرسنل آموزش ديده
مثالهای دسته بندی :
کلمات کليدی
keywords
گروه اعتباری
credit(low,medium,high)
دانشجوی سال اول کارشناسی ، سال دوم، دانشجوی ارشد، دکتری
تخمين
Estimation
تخصيص مقدار برای يک متغير پيوسته
نيازمند کلاسهای با تعريف مناسب
well-defined
می باشد.
ممکن است پايه ای برای دسته بندی باشد.
مرتب کردن و رنکينگ را ممکن می سازد.
از يک مقدار آستانه
threshold
استفاده می کند. مانند:
مقدار اعتبار
credit score
مثالهای تخمين :
تعداد فرزندان
حق بيمه
insurance premium
درآمد خانه داری
household income
پيشگويی
Prediction
دسته بندی/تخمين بر اساس مقادير و رفتارهای آينده صورت می گيرد.
ويژگی خروجی ممکن است مقدار عددی يا دسته ای
categorical
باشد.
استفاده از گذشته برای يادگرفتن درباره آينده :
از يک مدل وابستگی بين متغيرهای هدف و متغيرهای مستقل و يا بين رفتار کنونی و
گذشته
استفاده می شود.
مدل بر روی نتايج گذشته مشاهده شده اعمال می شود.
مثالها:
مدت زمان گرفتن يک درجه
پاسخ گويی به رقابتهای بازاريابی
marketing campaign
تعداد مسافران درتعطيلات آخر هفته
پيشگويی
Prediction
(ادامه)
مثال: مجموعه داده بيماران قلبی
پيشگويی
Prediction
(ادامه)
مثال: مجموعه داده بيماران قلبی(ادامه):