اخبار ، مقالات و تحقیقات گروهی را دنبال کنید.
آموزش الگوریتم جنگل تصادفی (Random Forest) در نرم افزار R و RStudio
آموزش الگوریتم جنگل تصادفی یا رندوم فارست در نرم افزار R منتشر شد.
امروزه در بسیاری از مواقع با حجم کلانی از داده ها مواجه هستیم. پیشرفت سریع تکنولوژی در قرن اخیر ما را با حجم عظیمی از اطلاعات مواجه کرده است. تحلیل این داده ها با توجه به متغیرهای کمکی فراوانی که معمولا در اختیار است، بسیار چالش برانگیز است. بعد بالای متغیرها و تاثیرات متفاوت آنها به همراه اثر متقابل متغیرها، موجب شده نحوه مدل بندی و تحلیل این گونه داده ها متفاوت از داده های معمول باشد. در این زمینه می توان به روش های داده کاوی برای تسهیل فرایند تحلیل داده ها مراجعه کرد. یکی از راه کارها برای مدل بندی و تحلیل این مجموعه داده ها استفاده از الگوریتم هایی با قابلیت محاسباتی بالاتر از قبیل جنگل تصادفی است.
جنگلهای تصادفی یا جنگلهای تصمیم تصادفی یک روش یادگیری ترکیبی برای دستهبندی و رگرسیون میباشد، که بر اساس ساختاری متشکل از شمار بسیاری درخت تصمیم، بر روی زمان آموزش و خروجی کلاسها (کلاسبندی) یا برای پیش بینیهای هر درخت به شکل مجزا، عمل میکنند.
مشخصات محصول
- مدرس: ابوالفضل بامری (عضو هیئت علمی دانشگاه زابل)
- تخصص: نقشه برداری رقومی خاک و ارزیابی تناسب اراضی
- موضوع: آموزش الگوریتم جنگل تصادفی (Random Forest) در نرم افزار R و RStudio
- نرم افزار: R و RStudio
- مخاطب: علاقه مندان به علم داده کاوی و برنامه نویسی و کاربران علوم مکانی
- نوع آموزش: ویدیویی (بیش از ۵ ساعت آموزش ویدیویی با فرمت MP4
- داده های تمرینی: دارد
- کد های آموزش: دارد
- پیش نیاز: مقدمه ای بر برنامه نویسی نرم افزار R و تحلیل مقدماتی داده های مکانی در نرم افزار R و RStudio
توضیحات محصول
در این مجموعه سعی شده است به صورت پروژه محور الگوریتم جنگل تصادفی برای دستهبندی و رگرسیون آموزش داده شود که موارد آموزشی شامل موارد ذیل می باشد:
الف) داده های آزمایشگاهی
طبقه بندی گونه های مختلف گل زنبق از سری دیتاست Iris
پیش بینی میزان جذب سرب فاضلاب شهری توسط فیلتر تراشه های لاستیکی
ب) داده های مکانی (دارای مختصات جغرافیایی)
پیش بینی میزان کربن آلی خاک بر اساس پارامترهای آزمایشگاهی در سطح دشت سیستان و تهیه نقشه پراکنش آن
طبقه بندی کلاس بافت خاک با استفاده از مشتقات DEM و تهیه نقشه بافت خاک شهرستان گرگان
ویدئوی بخشی از آموزش محصول
عناوین آموزشی
عناوین آموزش داده شده در این محصول عبارت اند از:
- آشنایی با دیتاست Iris
- بررسی آمار توصیفی داده ها
- محاسبه چولگی و کشیدگی داده ها
- بررسی نرمال بودن توزیع داده ها
- ترسیم نمودار چندک چندک (Q-Q plot) و هیستوگرام
- بررسی همبستگی داده ها
- ورود داده از Excel
- بررسی تعداد داده های گمشده (NA Data)
- تقسیم داده های ورودی به دو بخش آموزش و آزمون
- ایجاد مدل رگرسیون خطی و مدل رگرسیون جنگل تصادفی و مقایسه دقت مدل ها
- یافتن مطلوب ترین تعداد داده های ورودی در مدل جنگل تصادفی (Optimal mtry)
- یافتن مطلوب ترین تعداد درخت در مدل جنگل تصادفی (Optimal ntree)
- پیش بینی مقادیر داده جدید با استفاده از مدل جنگل تصادفی و ارزیابی آن
- مصورسازی اهمیت پارامترهای پیش بینی جنگل تصادفی
- ساخت شیپ فایل نقطه ای از داده های چهارچوب دار و فایل Excel
- ساخت فایل رستری از داده های چهارچوب دار و مصور سازی
- استخراج مقادیر سلول ها از فایل های رستری با استفاده از شیپ فایل نقطه ای
- تبدیل فایل رستری به فرمت kml و مصورسازی در نرم افزار Google earth
- محاسبه معیارهای ارزیابی مدل رگرسیون جنگل تصادفی شامل Bias, MSE,RMSE & R2
- محاسبه معیارهای ارزیابی مدل طبقه بندی جنگل تصادفی شامل Kappa & Accuracy
- آشنایی با بسته های ارزیابی مدل از قبیل ithir, ModelMetrics, caret
- آشنایی با بسته های psych, GGally, e1071, nortest
- مصور سازی دادهای آزمایشگاهی و دادهای مکانی با بسته های ggplot2,tmap, spplot
- ذخیره سازی داده های پیش بینی و طبقه بندی مدل به فرمت Excel 2007
معرفی الگوریتم جنگل تصادفی
«هوش مصنوعی» (Artificial Intelligence)، «یادگیری ماشین» (Machine Learning)، «علم داده» (Data Scientist) و «دادهکاوی» (Data Mining) از جمله موضوعات داغ روز هستند. این روزها، کمتر صنعتی مشاهده میشود که در آن به طور مستقیم یا غیرمستقیم از یادگیری ماشین استفاده نشود.
روشهای یادگیری ماشین (Machine Learning)، سیستمهای مختلف را قادر میکنند که یاد بگیرند، بررسی کنند و به ما پیشنهادهای کاربردی ارائه دهند. این سیستمها به مرور زمان که با دادهها، شبکهها و افراد تعامل دارند، باهوشتر میشوند. با استفاده از رویکردهای یادگیری ماشین و هوش مصنوعی، این سیستمها قادر هستند ما را در حل مسائل مهم، کاربردی و روزمره یاری دهند. غالبا این کار با استفاده از دادههایی انجام میشود که به دلیل حجم زیاد و یا ماهیت نامفهوم، برای ما انسانها چندان قابل استفاده نیست. تاکنون کاربردهای بسیار زیادی از هوش مصنوعی و یادگیری ماشین را در زندگی روزمره تجربه کردهایم. سرویسهای ایمیل برای تشخیص اسپم از الگوریتمهای یادگیری ماشین استفاده میکنند. سیستمهای پیشنهادگر، مرتبسازی نتایج موتورهای جستجو، تشخیص چهره خندان برای عکاسی خودکار، همگی نمونههای دیگری از کاربردهای یادگیری ماشین هستند.
ابزارها و روشهای مبتنی بر یادگیری ماشین، بر خلاف سایر ابداعات و اختراعات بشر، برای رفع محدودیتها و نیازهای فیزیکی نیستند، بلکه هدف آنها ساختن سیستمهایی است که به جای انسان بیاندیشند، یاد بگیرند و یاد بدهند.
در طی یک دهه آینده، به نظر میرسد که ما شاهد استفاده هر چه بیشتر یادگیری ماشین در طراحی سیستمهای دارای تعامل با انسان خواهیم بود.
روش جنگل تصادفی یکی از روشهای فراگیر یادگیری ماشین می باشد که کاربرد پیشگویانه رقابتی در زمینه های مختلف از جمله علوم بیولوژی، علوم زمین، مالی، مهندسی شیمی و غیره دارد. جنگل تصادفی را می توان یک الگوریتم یادگیری ماشین قابل انعطاف ، آسان برای استفاده مختلف پیش بینی و طبفه بندی معرفی کرد که حتی بدون تنظیم پارامترهای بیش از حد ، نتیجه بسیار خوبی را در اکثر اوقات تولید می کند. این روش جدید و قدرتمند، پیشــرفتهــای قابــل ملاحظــهای را در تکنولــوژی دادهکاوی ارائه داده است. همچنین یکی از الگوریتم های پرکاربرد است، زیرا به دلیل سادگی و تنوع آن می توان از آن برای انجام کارهای طبقه بندی و رگرسیون استفاده کرد.
تکنیک جنگل تصادفی مدل توسعه یافتهای از روش طبقه بندی و رگرسیون درختی CART می باشد. در روش جنگل تصادفی به جای رشد یک درخت صدها یا هزارن درخت طبقهبندی تولید می شود. در واقع این روش نوین یادگیری ماشین یک نوع مدرن و تحت نظارت از درخت- پایه هستند که شامل انبوهی از درخت های کلاس بندی و رگرسیونی می باشند که کاربرد اصلی آن در داده کاوی است و در حال حاضر یکی از بهترین الگوریتم های یادگیری است.
برای بهبود بخشیدن کارایی روش جنگل تصادفی می توان بر روی محور دقت و سرعت آن کار کرد. در زمینه بهبود دقت، با استفاده از ارزیابی ویژگیهای مختلف و ترکیب کردن توابع آن کار را جلو می برند. همچنین روش جنگل تصادفی دارای خواص موازی سازی است و می تواند به راحتی در جهت گسترش پذیری و بهبود کارایی موازی سازی شود.
خرید محصول
به منظور خرید این محصول آموزشی بر روی گزینه زیر کلیک کرده و بلافاصله دانلود نمایید.
چند آموزش مرتبط :
- مقدمه ای بر برنامه نویسی نرم افزار R و تحلیل مقدماتی داده های مکانی در نرم افزار R و RStudio
- آموزش طبقه بندی Random Forest
53 دیدگاه. ارسال دیدگاه جدید
سلام با تشکر از آموزش بسیار کاربردی تون
خواستم بپرسم این آموزش شامل تخفیف های دوره ای نمیشه؟
سلام و وقت بخیر
تخفیفات از طریق ایمیل اطلاع رسانی خواهند شد
موفق باشید
سلام
سوال من متوجه اقا احراری هست
من میخواهم دیتا های جربس را دانلود کنم
ولی هیچ امکان نداشت چون بعد از چند ثانیه خطا میدهد لطفا این کود را برسی کنید
https://code.earthengine.google.com/59f62090f03fe13cbecf6313647b3c7f
https://code.earthengine.google.com/59f62090f03fe13cbecf6313647b3c7f
تشکر
با سلام
لطفا این سوال را در قسمت مربوط به گوگل ارث انجین مطرح بفرمایید
موفق باشید
با سلام و احترام
لینک کد اصلاح شده ضمیمه شده است.
https://code.earthengine.google.com/07207889bde43db7ab29e17994cc4f2d
موفق باشید
با سلام
دوتا سوال داشتم ممنون میشم راهنمایی کنید: ۱- من میخوام نقشه رطوبت خاک ایجاد کنیم با استفاده از داده های سنتینل ۲ یا لندست(نمیدونم کدوم بهتره) ممنون میشم مراحل کار را بفرمایید؟(داده زمینی هم داخل پلات نمونه برداری دارم اما پراکنش زیادی ندارند و نزدیک به هم هستند).
۲- نقشه تبخیر و تعرق را چطوری ایجاد کنم؟ معادله پنمن مانتیث بهتره یا هارگریوز؟ و معادله ها را باید با نرم افزار خاصی محاسبه کرد؟
سلامک؛ در ارتباط با انتخاب ماهواره چون نمونه برداری مکانی تون نزدیک بهم هست بهتر است از داده های سنتینل استفاده کنید تا بهتر بتونید پارامترهای سنجش از دوری رو تفکیک کنید.
اما در ارتباط با تبخیر و تعرق، این که معادله پنمن مانتیث بهتره یا هارگریوز اولا بستگی به منطقه مورد مطالعه دارد باید ببینید منطقه مورد مطالعه مشابه با منطقه ای که معادله اصلی در آن کالیبره شده می باشد یا خیر.دوما بستگی به پارامترهای اقلیمی مورد نیاز و دسترس دارد. اما بطور کلی معادله پنمن مانتیث در کارهای علمی رایج تر می باشد. در ضمن براحتی در اکسل قابل محاسبه می باشد.
میشه بفرمایید مراحل تهیه نقشه رطوبت خاک با سنتینل ۱ به چه صورته؟ و از چه شاخص هایی میشه استفاده کرد(فک میکنم فقط سنتینل ۱ میشه و سنتینل ۲ واسه رطوبت خاک کاربردی نداره درسته؟
من نقشه تبخیر و تعرق میخوام با تصاویر چطوری میشه؟
سلام، روز بخیر …
ببخشید آیا طبقه بندی کلاس بافت خاک روی یک پرونده رستری انجام می شود؟
من می خواهم با بهره گیری از الگوریتم جنگل تصادفی در محیط R روی تصویر لندست طبقه بندی انجام بدهم، آیا تهیه این آموزش راهگشا است؟
سلام؛ اطلاعات که دادید ناقص هست.
اما ما در بخش تحلیل دادهای مکانی دو سناریو رو بکار بردیم:۱- داده های مکانی به صورت داده های چارچوب دار (data frame) مثل داده های اکسل ۲- دادهای مکانی به صورت شیپ فایل که فرمت S4 در نرم افزار R هست. و داده های رستری در R در این فرمت قرار می گیرند.
اگر داده های ورودی شما به صورت لایه های رستری باشه می تونید از سناریو دوم به راحتی استفاده کنید.
ولی توصیه می شه از کل بسته آموزشی یادگیری تون رو کامل کنید.
سلام، شب بخیر …
جناب بامری آیا با تهیه این آموزش توانایی طبقه بندی روی داده رستری (تصویر ماهواره ای) همچون نرم افزار envi و saga (با داده های آموزشی) را بدست می آورم؟
سلام؛ شب شما هم بخیر
اگر بتونید رفتار طیفی رو به صورت یه لایه رستری وارد مدل کنید بله میشه.
توصیه بنده این هست که برای هر طبقه رفتار طیفی باندهای مختلف رو در ابتدا به صورت dataframe استخراج و مدل سازی کنید و سپس نقشه نهایی با استفاده از مدل بهینه و نقشه های رستری بدست بیاورید.
در کل اگر مطالعه تون با مدل جنگل تصادفی هست حتما این آموزش برای شما مفید هست.
سپاس از شما جناب بامری
سلام وقت بخیر
من میخوام رگرسیون بین داده هامو پیدا کنم.همبستگی در رگرسیون خطی بسیار پایین هست میخواستم بدونم اگر این بسته رو بخرم میتونم نتیجه بهتری با رندوم فارست بگیرم؟ایا کدی که شما اموزش میدین برای داده های ما هم جواب میده؟ در بستع امدزش داده میشه که داده هامونو چکار کنیم تا کدی که اموزش میدین ران بشه و ارور نده؟ممنون میشم جواب بدین
سلام عموما مدل جنگل تصادفی به دلیل یافتن روابط بین پارامترهای ورودی و خروجی نتایج بهتر و قابل قبول تری نسبت به رگرسیون میده اما در صورتی که روابط بین پارامترها برقرار باشد.
در آموزش هم خطوط و کد دستوری ارائه میشه و شما می تونید براحتی از این کدها استفاده کنید.
در ضمن خط به خط کدها توضیح داده شده اند و شما می توانید کاربرد هر کد را فرابگیرید
سلام
وقت بخیر
میخواستم بدونم تو این ویدئو اموزشی. توضیح داده شده چجوری داده هامونو مرتب کنیم که کدی ک اموزش میدین ران بشه و ارور نده؟
بله
اگر هم مشکل و خطای هم ایجاد شد می تونید در این صفحه به اشتراک بگذارید یا به ایمیل بنده بفرستید. در اولین فرصت پاسخ داده می شود.
سلام و وقت بخیر
ببخشید از روش جنگل تصادفی علاوه بر طبقه بندی کاربری اراضی برای مدلسازی و پیش بینی تغییرات هم میشه استفاده کرد؟ و اینکه اینکار رو هم در نرم افزار R میشه انجام داد؟
سلام
بله در صورتی که تعداد داده هاتون زیاد باشه (عموما ۱۰۰ ردیف داده) و بتونه به خوبی آموزش ببینه میتونید مدلسازی هم با این روش انجام بدید
بله در نرم افزار r هست
سلام وقتتون بخیر ممنون بابت اطلاعات ارزنده تون. ببخشید من نیاز به داده ی رطوبت نسبی با رزولوشن مکانی خوب دارم. میشه لطفا بفرمایید از چه سایتی میتونم دانلود کنم؟ سپاسگزارم
سلام
خواهش میکنم
میتونید به سایت Giovanni مراجعه کنید که آموزش دسترسی به داده های اون رو دوست خوبمون آقای احراری به رایگان در اختیار گذاشتن.
درود بر شما من برای ریز مقیاس سازی از این الگوریتم استفاده می کنم چند نوع داده رستری ورودی دارم و یک نوع داده نقطه ای
این اموزش در این مورد کمکی به من می کنه؟
سلام
بله هم می تونید از داده های رستری تون یه فایل نقطه ای به صورت خروجی مقادیر استقاده کنید و هم می تونید داده نقطه ای تون رو به صورت رستری در بیارید و سپس مدلسازی کنید.
سلام و وقت بخیر
از پاسخگویی شما سپاسگزارم
همانطورکه فرمودید ارتباط بین دومتغیرم را در اکسل بررسی کردم و ضریب r2 حدود ۵۰% می باشد اما با اجرا دستور summary(lm.fit)[[“r.squared”]] ضریب رگرسیونی را ۷ % نشان می دهد .همچنین انتظار داشتم با اجرام رندوم فارست و خط دستوری
postResample رگرسیون بهتری نسبت به ضریب رگرسیونی اکسل به مشاهده کنم اما اینطور نشد ونتایج ضعیف تری به دست آمد. میخواستم بپرسم علت چه چیزی می تواند باشد؟ممکن است راهنمایی بفرمایید؟
سلام
عموما همبستگی بالای پارامترهای ورودی با پارامتر خروجی نتایج قابل قبولی را در جنگل تصادفی میدهد. با این وجود از پکیچ ithir هم برای ارزیابی مدل استفاده کنید و در تعیین داده های مشاهداتی و تخمین زده شده دقت کنید و ساختار جنگل تصادفی رو از لحاظ تعداد درختان و mtry تغییر دهید.
با سلام خدمت جناب آقای استاد بامری عزیز
شما package ithir را چطور نصب می کنید؟ آبا با کد خاصی نصب می کنید با از منبع CRAN یا Githup و… و یااینکه به صورت tar.gz؟ از منبع
install.packages(“ithir”, repos=”http://R-Forge.R-project.org”) اگر نصب نشود باید چکار کرد؟
ممنون
سلام دوست محترم
فایل زیپ شده را دانلود کنید و از نوار ابزار Tools و Install Packages فرمت نصب رو بزارید بر روی گزینه Package Aarchive File. و مسیر مورد نظر رو به نرم افزار بدید.
سلام. من قصد دارم با این روش مکان یابی انجام بدم. آیا این آموزش پاسخگوی نیاز بنده هست؟
سلام
اگر بتونید اطلاعات بیشتری از کار تحقیقاتی تون ارائه بدید. می تونم بهتر راهنمایی تون کنم. اما به طور کلی در این آموزش صرفا به موضوع مکان یابی اشاره ای نشده است. فقط اصل و محتوی کار آموزش اصول و روش اجرای مدل جنگل تصادفی (Random Forest) در نرم افزار R جهت رگرسیون و طبقه بندی می باشد.
سلام مجدد. وقت بخیر. بنده یه سری معیار و شاخص دارم ( معیارهایی مثل شرایط اقلیمی شامل دما و بارش و رطوبت ، معیار شرایط توپوگرافی شامل شیب و جهت و معیارهایی از این دست) که با توجه به این معیارها قراره بهترین مکان برای دهکده گردشری رو مشخص کنم. با توجه به این توضیحات این آموزش میتونه به من کمک کنه؟
ممنون از شما
سلام اگر با اصول مکانیابی آشنا باشید براحتی می شود این مورد را با جنگل تصادفی انجام داد. چند سناریو را می توانید انجام دهید که به نظر بنده بهترین سناریو این هست که برای تعداد نقاط مشاهداتی تون داده های نقطه ای از همه لایه ها استخراج کنید و سپس کلاس های مختلف هر نقطه رو خودتون مشخص کنید و با استفاده از مدل جنگل تصادفی کلاس های مختلف رو تخمین بزنید و بعد از بدست آوردن الگوریتم مناسب. لایه های مختلف را به صورت رستری به الگوریتم مورد نظر بدهید تا بهترین مکان را با خروجی نقشه دریافت کنید.
از لطف شما و پاسخ خوبتون بسیار ممنونم. سلامت باشید
خواهش می کنم موفق باشید ان شاءالله
سلام
من میخوام برای پایان نامم با نرم افزار آر در زمینه نقشه برداری رقومی خاک کار کنم با مدل های جنگل تصادفی و یادگیری عمیق
برای شروع راهنمایی کنید از کجا شروع کنم قبلا در این زمینه کار نکردم.
سپاس
با عرض سلام
توضیه میکنم آموزش ریر را نیز ببینید:
فیلم مستر کلاس آموزش نقشه برداری رقومی خاک – با استفاده از زبان برنامه نویسی R
سلام
این آموزش کاملا در راستای تحقیق شما می باشد و شما با یادگیری این آموزش می توانید کاملا بر روش نقشه برداری رقومی با استفاده ار دل جنگل تصادفی تسلط پیدا کنبد. برای آشنایی با سر فصل های این اموزش می تونید به فایل معرفی مراجعه کنید.
سلام آقای بامری من هرچه تلاش کردم نتونستم کتابخانه ithir راه اندازی کنم یعنی طبق آموزش شما از طریق فایلی که قرار دادید نصب نمیشه و کتابخانه فراخوانی نمیش لطفا راهنمایی کنید چگونه این کتابخانه را نصب کنم نسخه R 4.1.1 هستش
سلام آقای احمدی نصب این پکیچ چون در سابت مرجع Crane نیست کمی سخته هست. عموما در پیغام خطای که میده نام پکیج های که باید قبل از نصب این بسته نصب شود ذکر می شود. ابتدا این پکیج ها رو نصب کنید و بعد به این پکیج برسید. اگر هم نتوستید پیغام خطاتون برای بنده ایمیل کنید.
هم چنین از خط دستوری ذیل هم می تونید به عنوان کد و پکیج جایگزین استفاده کنید.
library(ParallelDSM)
myres<-CVfunction(pred,actual)
print(myres)
سلام جناب بامری
من ۵۰ تا ردیف و ۱۰ تا ستون دارم در اکسل. و میخوام لا رندوم فارست پیش بینی انجام بدم. که مثل رگرسیون ضرایب را بده تا بتونم معادله ای مثل رگرسیون بنویسم. سوالم اینه که خروجی رندوم فارست ضرایب هم میده تا بتونم با قرار دادن نقشه ها به جای متغیر x بتونم yرا بدست بیارم؟
سلام
در ابتدا باید بگم دریافت معادله مورد نظر شما برای جنگل تصادفی امکان پذیر نیست. این به این دلیل است که ماهیت الگوریتم جنگل تصادفی به طور ذاتی منجر به تخریب هر نمایش ساده ریاضی می شود.
جنگل تصادفی با ساختن درختهای تصمیمگیری و سپس جمعآوری آنها کار میکند و از این رو مقادیر بتا در جنگل تصادفی مشابهی ندارند. اگر چه شما مقادیر ” Variable Importance /Gini Index” را برای جنگل دریافت می کنید، که می تواند برای درک مدل استفاده شود اما به عنوان یک ضریب فاکتور محسوب نمی شود.
شما می توانید ضرایب را فقط برای مدل های خطی دریافت کنید.
در جنگل های تصادفی هیچ ضرایبی وجود ندارد. توصیه میکنم مقدمهای برای درختهای طبقهبندی و رگرسیون بخوانید تا بهتر با ساختار آن آشنا شوید.
در پایان می توان گفت هیچ مفهوم معنیداری از ضریب برای RF وجود ندارد (به جز معیار اهمیت RF).
موفق باشید
با سلام
من با spss modeler الگوریتم رندوم فارست را اجرا کردم و هدف من اینه که پارامترهای مهم را که بیشترین اثر را روی متغیر وابسته دارند را مشخص کنه، یعنی ۱۱ تا متغیر مستقل دارم از بین اینها میخوام مهمترینش را جدا کنه. خروجی که این ترم افزار به من آمد را چطوری میتونم براتون بفرستم که نتایجم درست هست یا نه؟
مثلا Rmse را ۰.۳ و
Relative error را ۰.۶۹
و variance explained را ۰.۳ داده، به نظرتون نتایج خوبه؟ ممنون میشم راهنمایی بفرمایید
سلام خدمت شما
بنده با نرم افزار spss این مدل را انجام ندادم. ولی در قانون کلی هر چقدر Rmse کوچکتر باشد نتایج بهتر می باشد. اما آماره مناسبی زیاد نمی باشد چون ماهیت آن تحت تاثیر نوع و مقادیر داده هست. امروزه در مقالات جدید از آماره NRMSE استفاده می شود. از طرفی شما می توانید از مقادیر ضریب تبیین یا همان R2 استفاده کنید. در مورد تعیین مهمترین پارامتر شما می توانید از دستور Importance در نرم افزار R استفاده کنید. با این دستور شما می توانید اهمیت پارامترها رو در تخمین مورد نظرتون در بازه 0 تا 100 مشاهده کنید.
با سلام
ذر الگوریتم جنگل تصادفی، منظور از variance explaned همون ضریب تبیین هست یا فرق میکنه؟ و مقدارش در چه رنجی باید باشه؟
در زمان پرینت گرفتن مدل ساخته شده با این پیغام روبرو می شید % Var explained این پیام در واقع بیان کننده توانایی مدل در توضیح یا مدلسازی پارامتر مورد نظر هست که هر چه به 100 نزدیک تر باشد بهتر است. می توان گفت همان ضریب تبیین هست.
سلام و عرض ادب
حضور جناب آقای بامری استاد بزرگوار
من یک فایل اکسل دارم با 18 ردیف و 19 ستون. یک متغیر وابسته که میخاهم پیش بینی کنم و بقیه متغیرهای مستقل. یکی از متغیرهای مستقل به صورت کیفی بوده که کدگذاری شده و یکی از ستونهاست. بقیه متغیر ها همگی اعشاری و پیوسته هستند و یکی از این متغیرهای اعشاری و پیوسته مقادیر منفی هم دارد و به همین دلیل استاندارد شده تا مقادیر منفی آن از بین رفته و بین صفر و یک شود. حالا سوال من این است برای اینکه معادله رگرسیونی چند متغیره را حساب کنم میتوانم از رندوم فارست استفاده کنم؟ از توجه شما ممنونم
سلام خانم
سپاس از شما
رگرسیون چند متغیره از جنگل تصادفی متفاوت هست. جهت مدل سازی از رگرسیون چند متغیره به عنوان یک مدل استفاده میشود. از طرفی اگر منظورتون این هست که با استفاده از جنگل تصادفی به مدل رگرسیونی برسید امکان ش نیست.
همچنین مدلسازی با جنگل تصادفی نیاز به تعداد ردیف بالاتر دارد.
سلام وقت بخیر استاد بامری
من جنگل تصادفی را می خواستم بر روی لایه های مکانی یگ متغییر (یک گونه زنده)انجام همین اموزش شما کافی هست و بالاترین MIR را بدست اورم
سلام جناب اسماعیلی امکانش هست بیشتر در این مورد توضیح بدید. که این پارامتر چی هست و چه نتیجه ای از جنگل تصادفی می خواهید بگیرید؟
سلام استاد گرامی من برای نصب پکیچ ithirدچار مشکل شدم و برام ارور میزنه و همچنین از روشی هم که داخل سایت فرمودید هم همین مشکل را دارم
> library(ithir)
Error: package or namespace load failed for ‘ithir’:
package ‘ithir’ was installed before R 4.0.0: please re-install it
>
> library(ParallelDSM)
> myres print(myres)
Error in h(simpleError(msg, call)) :
error in evaluating the argument ‘x’ in selecting a method for function ‘print’: object ‘myres’ not found
سلام
فایل myres تون باید یک دیتافریم با دوستون شامل مقادیر واقعی و پیش بینی داده هاتون باشد. در این خطا گفته اصلا چنین فایلی وجود ندارد.
سلام مجدد بر استاد گرامی
استاد من از اول کد این دیتا فریم را براش وارد کردم و تا اینجا که می خواست پکیچ ithir را نصب کنم و ارور داد و شما روش دیگری را معرفی کردید
و حالا به فرمایش شما برای رفع این مشکل چه کاری را باید انجام بدم
سلام در دستور که شما اجرا کردید که مشکل عدم مشخص کردن داده های واقعی و داده های پیش بینی هست شما می توانید براساس این کد کارتون رو جلو ببرید
CVfunction(pred, actual)
Arguments
pred : Value predicted by the model
actual : The real value
سلام و وقت بخیر استاد گرامی
استاد برای رندم فارست گرفتن می تونه مرز منطقه مورد مطالعه باشه یا باید به صورت یک مرز چهار گوش خارج از مرز براش تعریف بشه تا جواب بگیریم