کتاب Tidy Modeling with R (مدلسازی مرتب با R: چارچوبی برای مدلسازی در Tidyverse) یک منبع بسیار مناسب برای یادگیری آمار و پیادهسازی آن با استفاده از زبان برنامهنویسی R و چارچوب Tidyverse است. این کتاب در 21 فصل به صورت تخصصی مدلهای آماری متنوع را با استفاده از این چارچوب پیادهسازی کرده و آنها را شرح میدهد.
در ادامه مقدمهای از کتاب Tidy Modeling with R را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Tidy Modeling with R:
به Tidy Modeling با R خوش آمدید! این کتاب راهنمای استفاده از مجموعهای از نرمافزارهای زبان برنامهنویسی R برای مدلسازی به نام tidymodels است و دو هدف اصلی دارد:
اول از همه، این کتاب مقدمهای عملی در مورد نحوه استفاده از این بستههای R خاص برای ایجاد مدلها ارائه میدهد. ما روی گویش R به نام tidyverse تمرکز میکنیم که با یک فلسفه ثابت و انسان محور طراحی شده است و نشان میدهد که چگونه میتوان از بستههای tidyverse و tidymodels برای تولید مدلهای آماری و یادگیری ماشینی با کیفیت بالا استفاده کرد.
دوم، این کتاب به شما نشان میدهد که چگونه روشهای خوب و روشهای آماری را توسعه دهید. در صورت امکان، نرمافزار، اسناد و سایر مواد ما سعی میکنند از مشکلات رایج جلوگیری کنند.
در فصل 1 کتاب Tidy Modeling with R، طبقهبندی مدلها را مشخص میکنیم و نشان میدهیم که نرمافزار خوب برای مدلسازی چگونه است. ایدهها و نحو نظم و ترتیب که در فصل ۲ معرفی میکنیم (یا مرور میکنیم)، مبنایی برای رویکرد مدلهای مرتب به این چالشهای روششناسی و عملی است. فصل 3 یک مرور سریع از توابع مدلسازی پایه R معمولی ارائه میکند و نیازهای برآورده نشده در آن ناحیه را خلاصه میکند.
پس از آن، این کتاب به بخشهایی تقسیم میشود و با مبانی مدلسازی با اصول دادههای مرتب شروع میشود. فصلهای 4 تا 9 یک مجموعه داده نمونه را در مورد قیمت خانه معرفی میکنند و نحوه استفاده از بستههای مدلهای اصولی را نشان میدهند: دستور العملها، ازگیل، گردش کار، معیار، و موارد دیگر.
بخش بعدی کتاب Tidy Modeling with R با جزئیات بیشتر در مورد روند ایجاد یک مدل مؤثر پیش میرود. فصل های 10-15 بر ایجاد تخمینهای خوب از عملکرد و همچنین تنظیم فراپارامترهای مدل تمرکز دارند.
در نهایت، آخرین بخش کتاب Tidy Modeling with R، فصول 16-21 سایر موضوعات مهم برای ساخت مدل را پوشش میدهد. ما در مورد رویکردهای پیشرفتهتر مهندسی ویژگیها مانند کاهش ابعاد و رمزگذاری پیشبینیکنندههای با کاردینالیته بالا، و همچنین نحوه پاسخ به سؤالات درباره اینکه چرا یک مدل پیشبینیهای خاصی انجام میدهد و چه زمانی به پیشبینیهای مدل خود اعتماد کنیم، بحث میکنیم.
ما فرض نمیکنیم که خوانندگان تجربه گستردهای در ساخت مدل و آمار داشته باشند. برخی از دانشهای آماری مورد نیاز است، مانند نمونهگیری تصادفی، واریانس، همبستگی، رگرسیون خطی پایه و سایر موضوعاتی که معمولاً در دوره های آمار پایه کارشناسی یا تجزیه و تحلیل داده ها یافت میشوند.
ما فرض میکنیم که خواننده حداقل کمی با dplyr، ggplot2 و عملگر %>% “pipe” در R آشنا است و علاقهمند به استفاده از این ابزارها در مدلسازی است. برای کاربرانی که هنوز این دانش پیشزمینه R را ندارند، کتابهایی مانند R for Data Science توسط Wickham and Grolemund (2016) را توصیه میکنیم. بررسی و تجزیه و تحلیل دادهها بخش مهمی از هر فرآیند مدل است.
این کتاب به عنوان یک مرجع جامع در مورد تکنیکهای مدلسازی در نظر گرفته نشده است. ما منابع دیگری را برای کسب اطلاعات بیشتر در مورد روشهای آماری پیشنهاد میکنیم. برای پیشینه کلی رایج ترین نوع مدل، مدل خطی، ما Fox (2008) را پیشنهاد میکنیم.
برای مدلهای پیشبینی، کوهن و جانسون (2013) و کوهن و جانسون (2020) منابع خوبی هستند. برای روشهای یادگیری ماشین، Goodfellow، Bengio و Courville (2016) یک منبع عالی (اما رسمی) اطلاعات است. در برخی موارد، مدلهایی را که استفاده میکنیم، با جزئیات توضیح میدهیم، اما به گونهای که ریاضیات کمتری داشته باشد و امیدواریم شهودیتر باشد.
سرفصلهای کتاب Tidy Modeling with R:
- Preface
- I. Introduction
- 1. Software for Modeling
- 2. A Tidyverse Primer
- 3. A Review of R Modeling Fundamentals
- II. Modeling Basics
- 4. The Ames Housing Data
- 5. Spending Our Data
- 6. Fitting Models with parsnip
- 7. A Model Workflow
- 8. Feature Engineering with Recipes
- 9. Judging Model Effectiveness
- III. Tools for Creating Effective Models
- 10. Resampling for Evaluating Performance
- 11. Comparing Models with Resampling
- 12. Model Tuning and the Dangers of Overfitting
- 13. Grid Search
- 14. Iterative Search
- 15. Screening Many Models
- IV. Beyond the Basics
- 16. Dimensionality Reduction
- 17. Encoding Categorical Data
- 18. Explaining Models and Predictions
- 19. When Should You Trust Your Predictions?
- 20. Ensembles of Models
- 21. Inferential Analysis
- A. Recommended Preprocessing
- References
- Index
- About the Authors
جهت دانلود کتاب Tidy Modeling with R میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.