آموزش الگوریتم جنگل تصادفی (Random Forest) در نرم افزار R و RStudio

1,206 بازدید

اخبار ، مقالات و تحقیقات گروهی را دنبال کنید.

آموزش رایگان نرم افزار ENVI

در ENVI حرفه ای شو 🦾

0 تا 100 مفاهیم سنجش از دور

کاملا رایگان شروع کن 🧩

آموزش رایگان ArcGIS pro

واقعاااااا رایگاااااانه 🤗

آموزش گوگل ارث انجین

شدیدا توصیه شده 🌏

دانلود لندیوز 10 متری ایران و …

به کمک گوگل ارث انجین 🚀

کتاب موتور پردازش مجازی

اولین کتاب آموزش گوگل ارث انجین 📗

طبقه بندی تصاویر ماهواره ای

آشنایی با انواع روش ها 😲

پیش پردازش تصاویر ماهواره ای

هندسی – رادیومتریکی – اتمسفری 🀄

دانلود داده های آلتیمتری

ترازسنجی برای دریاچه ها 🧿

پوشش اراضی 10 متری

تولید شده توسط ESRI 🧐

نمایش سه بعدی در ArcGIS

مدل رقومی ارتفاع 🗻

مطالب پربازدید

آموزش الگوریتم جنگل تصادفی
آموزش الگوریتم جنگل تصادفی یا رندوم فارست در نرم افزار R منتشر شد. امروزه در بسیاری از مواقع با حجم کلانی از داده ها مواجه هستیم. پیشرفت سریع تکنولوژی در قرن اخیر ما را با حجم عظیمی از اطلاعات مواجه کرده است. تحلیل این داده ها با توجه به متغیرهای کمکی فراوانی که معمولا در اختیار است، بسیار چالش برانگیز…

آموزش الگوریتم جنگل تصادفی یا رندوم فارست در نرم افزار R منتشر شد.

امروزه در بسیاری از مواقع با حجم کلانی از داده ها مواجه هستیم. پیشرفت سریع تکنولوژی در قرن اخیر ما را با حجم عظیمی از اطلاعات مواجه کرده است. تحلیل این داده ها با توجه به متغیرهای کمکی فراوانی که معمولا در اختیار است، بسیار چالش برانگیز است. بعد بالای متغیرها و تاثیرات متفاوت آنها به همراه اثر متقابل متغیرها، موجب شده نحوه مدل بندی و تحلیل این گونه داده ها متفاوت از داده های معمول باشد. در این زمینه می توان به روش های داده کاوی برای تسهیل فرایند تحلیل داده ها مراجعه کرد. یکی از راه کارها برای مدل بندی و تحلیل این مجموعه داده ها استفاده از الگوریتم هایی با قابلیت محاسباتی بالاتر از قبیل جنگل تصادفی است.

جنگل‌های تصادفی یا جنگل‌های تصمیم تصادفی یک روش یادگیری ترکیبی برای دسته‌بندی و رگرسیون می‌باشد، که بر اساس ساختاری متشکل از شمار بسیاری درخت تصمیم، بر روی زمان آموزش و خروجی کلاس‌ها (کلاس‌بندی) یا برای پیش بینی‌های هر درخت به شکل مجزا، عمل می‌کنند.


مشخصات محصول

  • قیمت: 250 هزار تومان
  • مدرس: ابوالفضل بامری (عضو هیئت علمی دانشگاه زابل)
  • تخصص: نقشه برداری رقومی خاک و ارزیابی تناسب اراضی
  • موضوع: آموزش الگوریتم جنگل تصادفی (Random Forest) در نرم افزار R و RStudio
  • نرم افزار: R و RStudio
  • مخاطب: علاقه مندان به علم داده کاوی و برنامه نویسی و کاربران علوم مکانی
  • نوع آموزش: ویدیویی (بیش از ۵ ساعت آموزش ویدیویی با فرمت MP4)
  • پاورپوینت: ندارد
  • داده های تمرینی:‌ دارد
  • کد های آموزش: دارد
  • پیش نیاز: مقدمه ای بر برنامه نویسی نرم افزار R و تحلیل مقدماتی داده های مکانی در نرم افزار R و RStudio

توضیحات محصول

در این مجموعه سعی شده است به صورت پروژه محور الگوریتم جنگل تصادفی برای دسته‌بندی و رگرسیون آموزش داده شود که موارد آموزشی شامل موارد ذیل می باشد:

الف) داده های آزمایشگاهی

طبقه بندی گونه های مختلف گل زنبق از سری دیتاست Iris

پیش بینی میزان جذب سرب فاضلاب شهری توسط فیلتر تراشه های لاستیکی

ب) داده های مکانی (دارای مختصات جغرافیایی)

پیش بینی میزان کربن آلی خاک بر اساس پارامترهای آزمایشگاهی در سطح دشت سیستان و تهیه نقشه پراکنش آن

طبقه بندی کلاس بافت خاک با استفاده از مشتقات DEM و تهیه نقشه بافت خاک شهرستان گرگان


ویدئوی بخشی از آموزش محصول


عناوین آموزشی

عناوین آموزش داده شده در این محصول عبارت اند از:

  • آشنایی با دیتاست Iris
  • بررسی آمار توصیفی داده ها
  • محاسبه چولگی و کشیدگی داده ها
  • بررسی نرمال بودن توزیع داده ها
  • ترسیم نمودار چندک چندک (Q-Q plot) و هیستوگرام
  • بررسی همبستگی داده ها
  • ورود داده از Excel
  • بررسی تعداد داده های گمشده (NA Data)
  • تقسیم داده های ورودی به دو بخش آموزش و آزمون
  • ایجاد مدل رگرسیون خطی و مدل رگرسیون جنگل تصادفی و مقایسه دقت مدل ها
  • یافتن مطلوب ترین تعداد داده های ورودی در مدل جنگل تصادفی (Optimal mtry)
  • یافتن مطلوب ترین تعداد درخت در مدل جنگل تصادفی (Optimal ntree)
  • پیش بینی مقادیر داده جدید با استفاده از مدل جنگل تصادفی و ارزیابی آن
  • مصورسازی اهمیت پارامترهای پیش بینی جنگل تصادفی
  • ساخت شیپ فایل نقطه ای از داده های چهارچوب دار و فایل Excel
  • ساخت فایل رستری از داده های چهارچوب دار و مصور سازی
  • استخراج مقادیر سلول ها از فایل های رستری با استفاده از شیپ فایل نقطه ای
  • تبدیل فایل رستری به فرمت kml و مصورسازی در نرم افزار Google earth
  • محاسبه معیارهای ارزیابی مدل رگرسیون جنگل تصادفی شامل Bias, MSE,RMSE & R2
  • محاسبه معیارهای ارزیابی مدل طبقه بندی جنگل تصادفی شامل Kappa & Accuracy
  • آشنایی با بسته های ارزیابی مدل از قبیل ithir, ModelMetrics, caret
  • آشنایی با بسته های psych, GGally, e1071, nortest
  • مصور سازی دادهای آزمایشگاهی و دادهای مکانی با بسته های ggplot2,tmap, spplot
  • ذخیره سازی داده های پیش بینی و طبقه بندی مدل به فرمت Excel 2007

معرفی الگوریتم جنگل تصادفی

«هوش مصنوعی» (Artificial Intelligence)، «یادگیری ماشین» (Machine Learning)، «علم داده» (Data Scientist) و «داده‌کاوی» (Data Mining) از جمله موضوعات داغ روز هستند. این روزها، کمتر صنعتی مشاهده می‌شود که در آن به طور مستقیم یا غیرمستقیم از یادگیری ماشین استفاده نشود.

روش‌های یادگیری ماشین (Machine Learning)، سیستم‌های مختلف را قادر می‌کنند که یاد بگیرند، بررسی کنند و به ما پیشنهادهای کاربردی ارائه دهند. این سیستم‌ها به مرور زمان که با داده‌ها، شبکه‌ها و افراد تعامل دارند، باهوش‌تر می‌شوند. با استفاده از رویکردهای یادگیری ماشین و هوش مصنوعی، این سیستم‌ها قادر هستند ما را در حل مسائل مهم، کاربردی و روزمره یاری دهند. غالبا این کار با استفاده از داده‌هایی انجام می‌شود که به دلیل حجم زیاد و یا ماهیت نامفهوم، برای ما انسان‌ها چندان قابل استفاده نیست. تاکنون کاربردهای بسیار زیادی از هوش مصنوعی و یادگیری ماشین را در زندگی روزمره تجربه کرده‌ایم. سرویس‌های ایمیل برای تشخیص اسپم از الگوریتم‌های یادگیری ماشین استفاده می‌کنند. سیستم‌های پیشنهادگر، مرتب‌سازی نتایج موتورهای جستجو، تشخیص چهره خندان برای عکاسی خودکار، همگی نمونه‌های دیگری از کاربردهای یادگیری ماشین هستند.

ابزارها و روش‌های مبتنی بر یادگیری ماشین، بر خلاف سایر ابداعات و اختراعات بشر، برای رفع محدودیت‌ها و نیازهای فیزیکی نیستند، بلکه هدف آن‌ها ساختن سیستم‌هایی است که به جای انسان بیاندیشند، یاد بگیرند و یاد بدهند.

در طی یک دهه آینده، به نظر می‌رسد که ما شاهد استفاده هر چه بیشتر یادگیری ماشین در طراحی سیستم‌های دارای تعامل با انسان خواهیم بود.

آموزش الگوریتم راندوم فارست
آموزش الگوریتم راندوم فارست

روش جنگل تصادفی یکی از روشهای فراگیر یادگیری ماشین می باشد که کاربرد پیشگویانه رقابتی در زمینه های مختلف از جمله علوم بیولوژی، علوم زمین، مالی، مهندسی شیمی و غیره دارد. جنگل تصادفی را می توان یک الگوریتم یادگیری ماشین قابل انعطاف ، آسان برای استفاده مختلف پیش بینی و طبفه بندی معرفی کرد که حتی بدون تنظیم پارامترهای بیش از حد ، نتیجه بسیار خوبی را در اکثر اوقات تولید می کند. این روش جدید و قدرتمند، پیشــرفت‌هــای قابــل ملاحظــه‌ای را در تکنولــوژی داده‌کاوی ارائه داده است.  همچنین یکی از الگوریتم های پرکاربرد است، زیرا به دلیل سادگی و تنوع آن می توان از آن برای انجام کارهای طبقه بندی و رگرسیون استفاده کرد.

تکنیک جنگل تصادفی مدل توسعه یافته‌ای از روش طبقه‌ بندی و رگرسیون درختی CART می باشد. در روش جنگل تصادفی به جای رشد یک درخت صدها یا هزارن درخت طبقه‌بندی تولید می شود. در واقع این روش نوین یادگیری ماشین یک نوع مدرن و تحت نظارت از درخت- پایه هستند که شامل انبوهی از درخت های کلاس بندی و رگرسیونی می باشند که کاربرد اصلی آن در داده کاوی است و در حال حاضر یکی از بهترین الگوریتم های یادگیری است.

برای بهبود بخشیدن کارایی روش جنگل تصادفی می توان بر روی محور دقت و سرعت آن کار کرد. در زمینه بهبود دقت، با استفاده از ارزیابی ویژگیهای مختلف و ترکیب کردن توابع آن کار را جلو می برند. همچنین روش جنگل تصادفی دارای خواص موازی سازی است و می تواند به راحتی در جهت گسترش پذیری و بهبود کارایی موازی سازی شود.


خرید محصول

به منظور خرید این محصول آموزشی بر روی گزینه زیر کلیک کرده و بلافاصله دانلود نمایید.


چند آموزش مرتبط :


0/5 (0 نظر)

نوشته های مرتبط :

آموزش های رایگان پیشنهادی :

44 دیدگاه. ارسال دیدگاه جدید

  • سلام با تشکر از آموزش بسیار کاربردی تون
    خواستم بپرسم این آموزش شامل تخفیف های دوره ای نمیشه؟

    پاسخ
  • سلام
    سوال من متوجه اقا احراری هست
    من میخواهم دیتا های جربس را دانلود کنم
    ولی هیچ امکان نداشت چون بعد از چند ثانیه خطا میدهد لطفا این کود را برسی کنید
    https://code.earthengine.google.com/59f62090f03fe13cbecf6313647b3c7f
    https://code.earthengine.google.com/59f62090f03fe13cbecf6313647b3c7f
    تشکر

    پاسخ
  • با سلام
    دوتا سوال داشتم ممنون میشم راهنمایی کنید: ۱- من میخوام نقشه رطوبت خاک ایجاد کنیم با استفاده از داده های سنتینل ۲ یا لندست(نمیدونم کدوم بهتره) ممنون میشم مراحل کار را بفرمایید؟(داده زمینی هم داخل پلات نمونه برداری دارم اما پراکنش زیادی ندارند و نزدیک به هم هستند).
    ۲- نقشه تبخیر و تعرق را چطوری ایجاد کنم؟ معادله پنمن مانتیث بهتره یا هارگریوز؟ و معادله ها را باید با نرم افزار خاصی محاسبه کرد؟

    پاسخ
    • ابوالفضل بامری
      1399-08-14 10:15 ب.ظ

      سلامک؛ در ارتباط با انتخاب ماهواره چون نمونه برداری مکانی تون نزدیک بهم هست بهتر است از داده های سنتینل استفاده کنید تا بهتر بتونید پارامترهای سنجش از دوری رو تفکیک کنید.
      اما در ارتباط با تبخیر و تعرق، این که معادله پنمن مانتیث بهتره یا هارگریوز اولا بستگی به منطقه مورد مطالعه دارد باید ببینید منطقه مورد مطالعه مشابه با منطقه ای که معادله اصلی در آن کالیبره شده می باشد یا خیر.دوما بستگی به پارامترهای اقلیمی مورد نیاز و دسترس دارد. اما بطور کلی معادله پنمن مانتیث در کارهای علمی رایج تر می باشد. در ضمن براحتی در اکسل قابل محاسبه می باشد.

      پاسخ
  • میشه بفرمایید مراحل تهیه نقشه رطوبت خاک با سنتینل ۱ به چه صورته؟ و از چه شاخص هایی میشه استفاده کرد(فک میکنم فقط سنتینل ۱ میشه و سنتینل ۲ واسه رطوبت خاک کاربردی نداره درسته؟

    من نقشه تبخیر و تعرق میخوام با تصاویر چطوری میشه؟

    پاسخ
  • سلام، روز بخیر …
    ببخشید آیا طبقه بندی کلاس بافت خاک روی یک پرونده رستری انجام می شود؟
    من می خواهم با بهره گیری از الگوریتم جنگل تصادفی در محیط R روی تصویر لندست طبقه بندی انجام بدهم، آیا تهیه این آموزش راهگشا است؟

    پاسخ
    • ابوالفضل بامری
      1399-10-01 7:02 ب.ظ

      سلام؛ اطلاعات که دادید ناقص هست.
      اما ما در بخش تحلیل دادهای مکانی دو سناریو رو بکار بردیم:۱- داده های مکانی به صورت داده های چارچوب دار (data frame) مثل داده های اکسل ۲- دادهای مکانی به صورت شیپ فایل که فرمت S4 در نرم افزار R هست. و داده های رستری در R در این فرمت قرار می گیرند.
      اگر داده های ورودی شما به صورت لایه های رستری باشه می تونید از سناریو دوم به راحتی استفاده کنید.
      ولی توصیه می شه از کل بسته آموزشی یادگیری تون رو کامل کنید.

      پاسخ
  • سلام، شب بخیر …
    جناب بامری آیا با تهیه این آموزش توانایی طبقه بندی روی داده رستری (تصویر ماهواره ای) همچون نرم افزار envi و saga (با داده های آموزشی) را بدست می آورم؟

    پاسخ
    • ابوالفضل بامری
      1399-10-01 11:42 ب.ظ

      سلام؛ شب شما هم بخیر
      اگر بتونید رفتار طیفی رو به صورت یه لایه رستری وارد مدل کنید بله میشه.
      توصیه بنده این هست که برای هر طبقه رفتار طیفی باندهای مختلف رو در ابتدا به صورت dataframe استخراج و مدل سازی کنید و سپس نقشه نهایی با استفاده از مدل بهینه و نقشه های رستری بدست بیاورید.
      در کل اگر مطالعه تون با مدل جنگل تصادفی هست حتما این آموزش برای شما مفید هست.

      پاسخ
  • سپاس از شما جناب بامری

    پاسخ
  • سلام وقت بخیر
    من میخوام رگرسیون بین داده هامو پیدا کنم.همبستگی در رگرسیون خطی بسیار پایین هست میخواستم بدونم اگر این بسته رو بخرم میتونم نتیجه بهتری با رندوم فارست بگیرم؟ایا کدی که شما اموزش میدین برای داده های ما هم جواب میده؟ در بستع امدزش داده میشه که داده هامونو چکار کنیم تا کدی که اموزش میدین ران بشه و ارور نده؟ممنون میشم جواب بدین

    پاسخ
    • ابوالفضل بامری
      1399-11-05 10:54 ب.ظ

      سلام عموما مدل جنگل تصادفی به دلیل یافتن روابط بین پارامترهای ورودی و خروجی نتایج بهتر و قابل قبول تری نسبت به رگرسیون میده اما در صورتی که روابط بین پارامترها برقرار باشد.
      در آموزش هم خطوط و کد دستوری ارائه میشه و شما می تونید براحتی از این کدها استفاده کنید.
      در ضمن خط به خط کدها توضیح داده شده اند و شما می توانید کاربرد هر کد را فرابگیرید

      پاسخ
  • سلام
    وقت بخیر
    میخواستم بدونم تو این ویدئو اموزشی. توضیح داده شده چجوری داده هامونو مرتب کنیم که کدی ک اموزش میدین ران بشه و ارور نده؟

    پاسخ
    • ابوالفضل بامری
      1399-11-05 10:56 ب.ظ

      بله
      اگر هم مشکل و خطای هم ایجاد شد می تونید در این صفحه به اشتراک بگذارید یا به ایمیل بنده بفرستید. در اولین فرصت پاسخ داده می شود.

      پاسخ
  • سلام و وقت بخیر
    ببخشید از روش جنگل تصادفی علاوه بر طبقه بندی کاربری اراضی برای مدلسازی و پیش بینی تغییرات هم میشه استفاده کرد؟ و اینکه اینکار رو هم در نرم افزار R میشه انجام داد؟

    پاسخ
    • ابوالفضل بامری
      1399-12-06 3:13 ب.ظ

      سلام
      بله در صورتی که تعداد داده هاتون زیاد باشه (عموما ۱۰۰ ردیف داده) و بتونه به خوبی آموزش ببینه میتونید مدلسازی هم با این روش انجام بدید
      بله در نرم افزار r هست

      پاسخ
  • سلام وقتتون بخیر ممنون بابت اطلاعات ارزنده تون. ببخشید من نیاز به داده ی رطوبت نسبی با رزولوشن مکانی خوب دارم. میشه لطفا بفرمایید از چه سایتی میتونم دانلود کنم؟ سپاسگزارم

    پاسخ
    • ابوالفضل بامری
      1399-12-06 3:21 ب.ظ

      سلام
      خواهش میکنم
      میتونید به سایت Giovanni مراجعه کنید که آموزش دسترسی به داده های اون رو دوست خوبمون آقای احراری به رایگان در اختیار گذاشتن.

      پاسخ
  • Mohammad sadegh
    1399-12-06 9:32 ب.ظ

    درود بر شما من برای ریز مقیاس سازی از این الگوریتم استفاده می کنم چند نوع داده رستری ورودی دارم و یک نوع داده نقطه ای
    این اموزش در این مورد کمکی به من می کنه؟

    پاسخ
    • ابوالفضل بامری
      1399-12-07 4:48 ب.ظ

      سلام
      بله هم می تونید از داده های رستری تون یه فایل نقطه ای به صورت خروجی مقادیر استقاده کنید و هم می تونید داده نقطه ای تون رو به صورت رستری در بیارید و سپس مدلسازی کنید.

      پاسخ
  • سلام و وقت بخیر
    از پاسخگویی شما سپاسگزارم
    همانطورکه فرمودید ارتباط بین دومتغیرم را در اکسل بررسی کردم و ضریب r2 حدود ۵۰% می باشد اما با اجرا دستور summary(lm.fit)[[“r.squared”]] ضریب رگرسیونی را ۷ % نشان می دهد .همچنین انتظار داشتم با اجرام رندوم فارست و خط دستوری
    postResample رگرسیون بهتری نسبت به ضریب رگرسیونی اکسل به مشاهده کنم اما اینطور نشد ونتایج ضعیف تری به دست آمد. میخواستم بپرسم علت چه چیزی می تواند باشد؟ممکن است راهنمایی بفرمایید؟

    پاسخ
    • ابوالفضل بامری
      1399-12-25 1:14 ق.ظ

      سلام
      عموما همبستگی بالای پارامترهای ورودی با پارامتر خروجی نتایج قابل قبولی را در جنگل تصادفی میدهد. با این وجود از پکیچ ithir هم برای ارزیابی مدل استفاده کنید و در تعیین داده های مشاهداتی و تخمین زده شده دقت کنید و ساختار جنگل تصادفی رو از لحاظ تعداد درختان و mtry تغییر دهید.

      پاسخ
  • کمال خسروی اقدم
    1400-02-14 12:21 ق.ظ

    با سلام خدمت جناب آقای استاد بامری عزیز
    شما package ithir را چطور نصب می کنید؟ آبا با کد خاصی نصب می کنید با از منبع CRAN یا Githup و… و یااینکه به صورت tar.gz؟ از منبع
    install.packages(“ithir”, repos=”http://R-Forge.R-project.org”) اگر نصب نشود باید چکار کرد؟
    ممنون

    پاسخ
    • ابوالفضل بامری
      1400-02-14 4:34 ب.ظ

      سلام دوست محترم
      فایل زیپ شده را دانلود کنید و از نوار ابزار Tools و Install Packages فرمت نصب رو بزارید بر روی گزینه Package Aarchive File. و مسیر مورد نظر رو به نرم افزار بدید.

      پاسخ
  • آوین ناصری
    1400-02-19 11:18 ب.ظ

    سلام. من قصد دارم با این روش مکان یابی انجام بدم. آیا این آموزش پاسخگوی نیاز بنده هست؟

    پاسخ
    • ابوالفضل بامری
      1400-02-20 10:42 ق.ظ

      سلام
      اگر بتونید اطلاعات بیشتری از کار تحقیقاتی تون ارائه بدید. می تونم بهتر راهنمایی تون کنم. اما به طور کلی در این آموزش صرفا به موضوع مکان یابی اشاره ای نشده است. فقط اصل و محتوی کار آموزش اصول و روش اجرای مدل جنگل تصادفی (Random Forest) در نرم افزار R جهت رگرسیون و طبقه بندی می باشد.

      پاسخ
      • آوین ناصری
        1400-02-28 3:28 ب.ظ

        سلام مجدد. وقت بخیر. بنده یه سری معیار و شاخص دارم ( معیارهایی مثل شرایط اقلیمی شامل دما و بارش و رطوبت ، معیار شرایط توپوگرافی شامل شیب و جهت و معیارهایی از این دست) که با توجه به این معیارها قراره بهترین مکان برای دهکده گردشری رو مشخص کنم. با توجه به این توضیحات این آموزش میتونه به من کمک کنه؟
        ممنون از شما

        پاسخ
  • ابوالفضل بامری
    1400-02-30 3:35 ب.ظ

    سلام اگر با اصول مکانیابی آشنا باشید براحتی می شود این مورد را با جنگل تصادفی انجام داد. چند سناریو را می توانید انجام دهید که به نظر بنده بهترین سناریو این هست که برای تعداد نقاط مشاهداتی تون داده های نقطه ای از همه لایه ها استخراج کنید و سپس کلاس های مختلف هر نقطه رو خودتون مشخص کنید و با استفاده از مدل جنگل تصادفی کلاس های مختلف رو تخمین بزنید و بعد از بدست آوردن الگوریتم مناسب. لایه های مختلف را به صورت رستری به الگوریتم مورد نظر بدهید تا بهترین مکان را با خروجی نقشه دریافت کنید.

    پاسخ
  • سلام
    من میخوام برای پایان نامم با نرم افزار آر در زمینه نقشه برداری رقومی خاک کار کنم با مدل های جنگل تصادفی و یادگیری عمیق
    برای شروع راهنمایی کنید از کجا شروع کنم قبلا در این زمینه کار نکردم.
    سپاس

    پاسخ
  • سلام آقای بامری من هرچه تلاش کردم نتونستم کتابخانه ithir راه اندازی کنم یعنی طبق آموزش شما از طریق فایلی که قرار دادید نصب نمیشه و کتابخانه فراخوانی نمیش لطفا راهنمایی کنید چگونه این کتابخانه را نصب کنم نسخه R 4.1.1 هستش

    پاسخ
    • ابوالفضل بامري
      1400-07-09 8:44 ب.ظ

      سلام آقای احمدی نصب این پکیچ چون در سابت مرجع Crane نیست کمی سخته هست. عموما در پیغام خطای که میده نام پکیج های که باید قبل از نصب این بسته نصب شود ذکر می شود. ابتدا این پکیج ها رو نصب کنید و بعد به این پکیج برسید. اگر هم نتوستید پیغام خطاتون برای بنده ایمیل کنید.
      هم چنین از خط دستوری ذیل هم می تونید به عنوان کد و پکیج جایگزین استفاده کنید.

      library(ParallelDSM)
      myres<-CVfunction(pred,actual)
      print(myres)

      پاسخ
  • سلام جناب بامری
    من ۵۰ تا ردیف و ۱۰ تا ستون دارم در اکسل. و میخوام لا رندوم فارست پیش بینی انجام بدم. که مثل رگرسیون ضرایب را بده تا بتونم معادله ای مثل رگرسیون بنویسم. سوالم اینه که خروجی رندوم فارست ضرایب هم میده تا بتونم با قرار دادن نقشه ها به جای متغیر x بتونم yرا بدست بیارم؟

    پاسخ
    • ابوالفضل بامري
      1400-08-04 11:13 ب.ظ

      سلام
      در ابتدا باید بگم دریافت معادله مورد نظر شما برای جنگل تصادفی امکان پذیر نیست. این به این دلیل است که ماهیت الگوریتم جنگل تصادفی به طور ذاتی منجر به تخریب هر نمایش ساده ریاضی می شود.
      جنگل تصادفی با ساختن درخت‌های تصمیم‌گیری و سپس جمع‌آوری آن‌ها کار می‌کند و از این رو مقادیر بتا در جنگل تصادفی مشابهی ندارند. اگر چه شما مقادیر ” Variable Importance /Gini Index” را برای جنگل دریافت می کنید، که می تواند برای درک مدل استفاده شود اما به عنوان یک ضریب فاکتور محسوب نمی شود.
      شما می توانید ضرایب را فقط برای مدل های خطی دریافت کنید.
      در جنگل های تصادفی هیچ ضرایبی وجود ندارد. توصیه می‌کنم مقدمه‌ای برای درخت‌های طبقه‌بندی و رگرسیون بخوانید تا بهتر با ساختار آن آشنا شوید.
      در پایان می توان گفت هیچ مفهوم معنی‌داری از ضریب برای RF وجود ندارد (به جز معیار اهمیت RF).
      موفق باشید

      پاسخ
  • با سلام
    من با spss modeler الگوریتم رندوم فارست را اجرا کردم و هدف من اینه که پارامترهای مهم را که بیشترین اثر را روی متغیر وابسته دارند را مشخص کنه، یعنی ۱۱ تا متغیر مستقل دارم از بین اینها میخوام مهمترینش را جدا کنه. خروجی که این ترم افزار به من آمد را چطوری میتونم براتون بفرستم که نتایجم درست هست یا نه؟
    مثلا Rmse را ۰.۳ و
    Relative error را ۰.۶۹
    و variance explained را ۰.۳ داده، به نظرتون نتایج خوبه؟ ممنون میشم راهنمایی بفرمایید

    پاسخ
    • ابوالفضل بامری
      1400-09-01 9:51 ب.ظ

      سلام خدمت شما

      بنده با نرم افزار spss این مدل را انجام ندادم. ولی در قانون کلی هر چقدر Rmse کوچکتر باشد نتایج بهتر می باشد. اما آماره مناسبی زیاد نمی باشد چون ماهیت آن تحت تاثیر نوع و مقادیر داده هست. امروزه در مقالات جدید از آماره NRMSE استفاده می شود. از طرفی شما می توانید از مقادیر ضریب تبیین یا همان R2 استفاده کنید. در مورد تعیین مهمترین پارامتر شما می توانید از دستور Importance در نرم افزار R استفاده کنید. با این دستور شما می توانید اهمیت پارامترها رو در تخمین مورد نظرتون در بازه 0 تا 100 مشاهده کنید.

      پاسخ
  • با سلام
    ذر الگوریتم جنگل تصادفی، منظور از variance explaned همون ضریب تبیین هست یا فرق میکنه؟ و مقدارش در چه رنجی باید باشه؟

    پاسخ
  • ابوالفضل بامري
    1400-12-12 11:25 ب.ظ

    در زمان پرینت گرفتن مدل ساخته شده با این پیغام روبرو می شید % Var explained این پیام در واقع بیان کننده توانایی مدل در توضیح یا مدلسازی پارامتر مورد نظر هست که هر چه به 100 نزدیک تر باشد بهتر است. می توان گفت همان ضریب تبیین هست.

    پاسخ

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.