برنامه نویسی محصولات دانلودی

آموزش الگوریتم جنگل تصادفی (Random Forest) در نرم افزار R و RStudio

آموزش الگوریتم جنگل تصادفی
مهندس ابوالفضل بامری
نوشته شده توسط مهندس ابوالفضل بامری

آموزش الگوریتم جنگل تصادفی یا رندوم فارست در نرم افزار R منتشر شد.

امروزه در بسیاری از مواقع با حجم کلانی از داده ها مواجه هستیم. پیشرفت سریع تکنولوژی در قرن اخیر ما را با حجم عظیمی از اطلاعات مواجه کرده است. تحلیل این داده ها با توجه به متغیرهای کمکی فراوانی که معمولا در اختیار است، بسیار چالش برانگیز است. بعد بالای متغیرها و تاثیرات متفاوت آنها به همراه اثر متقابل متغیرها، موجب شده نحوه مدل بندی و تحلیل این گونه داده ها متفاوت از داده های معمول باشد. در این زمینه می توان به روش های داده کاوی برای تسهیل فرایند تحلیل داده ها مراجعه کرد. یکی از راه کارها برای مدل بندی و تحلیل این مجموعه داده ها استفاده از الگوریتم هایی با قابلیت محاسباتی بالاتر از قبیل جنگل تصادفی است.

جنگل‌های تصادفی یا جنگل‌های تصمیم تصادفی یک روش یادگیری ترکیبی برای دسته‌بندی و رگرسیون می‌باشد، که بر اساس ساختاری متشکل از شمار بسیاری درخت تصمیم، بر روی زمان آموزش و خروجی کلاس‌ها (کلاس‌بندی) یا برای پیش بینی‌های هر درخت به شکل مجزا، عمل می‌کنند.


مشخصات محصول

  • قیمت: ۱۵۰۰۰۰ تومان
  • مدرس: ابوالفضل بامری (عضو هیئت علمی دانشگاه زابل)
  • تخصص: نقشه برداری رقومی خاک و ارزیابی تناسب اراضی
  • موضوع: آموزش الگوریتم جنگل تصادفی (Random Forest) در نرم افزار R و RStudio
  • نرم افزار: R و RStudio
  • مخاطب: علاقه مندان به علم داده کاوی و برنامه نویسی و کاربران علوم مکانی
  • نوع آموزش: ویدیویی (بیش از ۵ ساعت آموزش ویدیویی با فرمت MP4)
  • پاورپوینت: ندارد
  • داده های تمرینی:‌ دارد
  • کد های آموزش: دارد
  • پیش نیاز: مقدمه ای بر برنامه نویسی نرم افزار R و تحلیل مقدماتی داده های مکانی در نرم افزار R و RStudio

توضیحات محصول

در این مجموعه سعی شده است به صورت پروژه محور الگوریتم جنگل تصادفی برای دسته‌بندی و رگرسیون آموزش داده شود که موارد آموزشی شامل موارد ذیل می باشد:

الف) داده های آزمایشگاهی

طبقه بندی گونه های مختلف گل زنبق از سری دیتاست Iris

پیش بینی میزان جذب سرب فاضلاب شهری توسط فیلتر تراشه های لاستیکی

ب) داده های مکانی (دارای مختصات جغرافیایی)

پیش بینی میزان کربن آلی خاک بر اساس پارامترهای آزمایشگاهی در سطح دشت سیستان و تهیه نقشه پراکنش آن

طبقه بندی کلاس بافت خاک با استفاده از مشتقات DEM و تهیه نقشه بافت خاک شهرستان گرگان


ویدئوی بخشی از آموزش محصول


عناوین آموزشی

عناوین آموزش داده شده در این محصول عبارت اند از:

  • آشنایی با دیتاست Iris
  • بررسی آمار توصیفی داده ها
  • محاسبه چولگی و کشیدگی داده ها
  • بررسی نرمال بودن توزیع داده ها
  • ترسیم نمودار چندک چندک (Q-Q plot) و هیستوگرام
  • بررسی همبستگی داده ها
  • ورود داده از Excel
  • بررسی تعداد داده های گمشده (NA Data)
  • تقسیم داده های ورودی به دو بخش آموزش و آزمون
  • ایجاد مدل رگرسیون خطی و مدل رگرسیون جنگل تصادفی و مقایسه دقت مدل ها
  • یافتن مطلوب ترین تعداد داده های ورودی در مدل جنگل تصادفی (Optimal mtry)
  • یافتن مطلوب ترین تعداد درخت در مدل جنگل تصادفی (Optimal ntree)
  • پیش بینی مقادیر داده جدید با استفاده از مدل جنگل تصادفی و ارزیابی آن
  • مصورسازی اهمیت پارامترهای پیش بینی جنگل تصادفی
  • ساخت شیپ فایل نقطه ای از داده های چهارچوب دار و فایل Excel
  • ساخت فایل رستری از داده های چهارچوب دار و مصور سازی
  • استخراج مقادیر سلول ها از فایل های رستری با استفاده از شیپ فایل نقطه ای
  • تبدیل فایل رستری به فرمت kml و مصورسازی در نرم افزار Google earth
  • محاسبه معیارهای ارزیابی مدل رگرسیون جنگل تصادفی شامل Bias, MSE,RMSE & R2
  • محاسبه معیارهای ارزیابی مدل طبقه بندی جنگل تصادفی شامل Kappa & Accuracy
  • آشنایی با بسته های ارزیابی مدل از قبیل ithir, ModelMetrics, caret
  • آشنایی با بسته های psych, GGally, e1071, nortest
  • مصور سازی دادهای آزمایشگاهی و دادهای مکانی با بسته های ggplot2,tmap, spplot
  • ذخیره سازی داده های پیش بینی و طبقه بندی مدل به فرمت Excel 2007

معرفی الگوریتم جنگل تصادفی

«هوش مصنوعی» (Artificial Intelligence)، «یادگیری ماشین» (Machine Learning)، «علم داده» (Data Scientist) و «داده‌کاوی» (Data Mining) از جمله موضوعات داغ روز هستند. این روزها، کمتر صنعتی مشاهده می‌شود که در آن به طور مستقیم یا غیرمستقیم از یادگیری ماشین استفاده نشود.

روش‌های یادگیری ماشین (Machine Learning)، سیستم‌های مختلف را قادر می‌کنند که یاد بگیرند، بررسی کنند و به ما پیشنهادهای کاربردی ارائه دهند. این سیستم‌ها به مرور زمان که با داده‌ها، شبکه‌ها و افراد تعامل دارند، باهوش‌تر می‌شوند. با استفاده از رویکردهای یادگیری ماشین و هوش مصنوعی، این سیستم‌ها قادر هستند ما را در حل مسائل مهم، کاربردی و روزمره یاری دهند. غالبا این کار با استفاده از داده‌هایی انجام می‌شود که به دلیل حجم زیاد و یا ماهیت نامفهوم، برای ما انسان‌ها چندان قابل استفاده نیست. تاکنون کاربردهای بسیار زیادی از هوش مصنوعی و یادگیری ماشین را در زندگی روزمره تجربه کرده‌ایم. سرویس‌های ایمیل برای تشخیص اسپم از الگوریتم‌های یادگیری ماشین استفاده می‌کنند. سیستم‌های پیشنهادگر، مرتب‌سازی نتایج موتورهای جستجو، تشخیص چهره خندان برای عکاسی خودکار، همگی نمونه‌های دیگری از کاربردهای یادگیری ماشین هستند.

ابزارها و روش‌های مبتنی بر یادگیری ماشین، بر خلاف سایر ابداعات و اختراعات بشر، برای رفع محدودیت‌ها و نیازهای فیزیکی نیستند، بلکه هدف آن‌ها ساختن سیستم‌هایی است که به جای انسان بیاندیشند، یاد بگیرند و یاد بدهند.

در طی یک دهه آینده، به نظر می‌رسد که ما شاهد استفاده هر چه بیشتر یادگیری ماشین در طراحی سیستم‌های دارای تعامل با انسان خواهیم بود.

آموزش الگوریتم راندوم فارست

آموزش الگوریتم راندوم فارست

روش جنگل تصادفی یکی از روشهای فراگیر یادگیری ماشین می باشد که کاربرد پیشگویانه رقابتی در زمینه های مختلف از جمله علوم بیولوژی، علوم زمین، مالی، مهندسی شیمی و غیره دارد. جنگل تصادفی را می توان یک الگوریتم یادگیری ماشین قابل انعطاف ، آسان برای استفاده مختلف پیش بینی و طبفه بندی معرفی کرد که حتی بدون تنظیم پارامترهای بیش از حد ، نتیجه بسیار خوبی را در اکثر اوقات تولید می کند. این روش جدید و قدرتمند، پیشــرفت‌هــای قابــل ملاحظــه‌ای را در تکنولــوژی داده‌کاوی ارائه داده است.  همچنین یکی از الگوریتم های پرکاربرد است، زیرا به دلیل سادگی و تنوع آن می توان از آن برای انجام کارهای طبقه بندی و رگرسیون استفاده کرد.

تکنیک جنگل تصادفی مدل توسعه یافته‌ای از روش طبقه‌ بندی و رگرسیون درختی CART می باشد. در روش جنگل تصادفی به جای رشد یک درخت صدها یا هزارن درخت طبقه‌بندی تولید می شود. در واقع این روش نوین یادگیری ماشین یک نوع مدرن و تحت نظارت از درخت- پایه هستند که شامل انبوهی از درخت های کلاس بندی و رگرسیونی می باشند که کاربرد اصلی آن در داده کاوی است و در حال حاضر یکی از بهترین الگوریتم های یادگیری است.

برای بهبود بخشیدن کارایی روش جنگل تصادفی می توان بر روی محور دقت و سرعت آن کار کرد. در زمینه بهبود دقت، با استفاده از ارزیابی ویژگیهای مختلف و ترکیب کردن توابع آن کار را جلو می برند. همچنین روش جنگل تصادفی دارای خواص موازی سازی است و می تواند به راحتی در جهت گسترش پذیری و بهبود کارایی موازی سازی شود.


خرید محصول

به منظور خرید این محصول آموزشی بر روی گزینه زیر کلیک کرده و بلافاصله دانلود نمایید.


چند آموزش مرتبط :


 

۵ دیدگاه

دیدگاهتان را بنویسید

اگر تمایل به تدریس و تولید آموزش و کسب درآمد دارید بر روی دکمه رو به رو کلیک کنید و فرم را پر کنیدلطفا کلیک کنید
+ +