کتاب R in Action یا آر در عمل، نسخه سوم که به تازگی در سال 2022 به چاپ رسیده است. این کتاب در 22 فصل به آموزش کامل مفاهیم دادهکاوی و پیادهسازی آنها میپردازد. همچنین کدها و مثالهایی برای تشریح مفاهیم مهم دادهکاوی در این کتاب توضیح داده شده است.
در ادامه مقدمهای از کتاب R in Action را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب R in Action:
اگر این کتاب را انتخاب کردهاید، احتمالاً دادههایی دارید که باید آنها را جمعآوری، خلاصه، تبدیل، کاوش، مدلسازی، تجسم یا ارائه کنید. اگر چنین است، پس R برای شما مناسب است. R به زبان جهانی برای آمار، تجزیه و تحلیل پیشبینی و تجسم دادهها تبدیل شده است. این گستره وسیعترین روشها را برای درک دادههای موجود، از ابتداییترین تا پیچیدهترین و پرخونترین، ارائه میدهد.
به عنوان یک پروژه منبع باز، به صورت رایگان برای طیف وسیعی از پلتفرمها از جمله ویندوز، macOS و لینوکس در دسترس است. این در حال توسعه مداوم است، با روشهای جدید روزانه اضافه میشود. علاوه بر این، R توسط یک جامعه بزرگ و متنوع از دانشمندان داده و برنامهنویسان پشتیبانی میشود که با کمال میل کمک و مشاوره خود را به کاربران ارائه میدهند.
اگرچه R احتمالاً بیشتر به دلیل توانایی خود در ایجاد نمودارهای زیبا و پیچیده شناخته شده است، اما میتواند تقریباً هر مشکل آماری را مدیریت کند. نصب پایه صدها کارکرد مدیریت داده، آماری و گرافیکی را مستقیماً از جعبه ارائه میدهد. اما برخی از قدرتمندترین ویژگیهای آن از هزاران افزونه (بسته) ارائه شده توسط نویسندگان مشارکتکننده ناشی میشود.
این وسعت قیمتی دارد. برای کاربران جدید سخت است که بفهمند R چیست و چه کاری میتواند انجام دهد. حتی باتجربهترین کاربر R میتواند از دانستن ویژگیهایی که از آنها بیاطلاع است شگفتزده شود.
R in Action، نسخه سوم، یک معرفی راهنما از R، یک نمای 2000 فوتی از پلتفرم و قابلیتهای آن در اختیار شما قرار میدهد. شما را با مهمترین عملکردها در نصب پایه و بیش از 70 مورد از مفیدترین بستههای کمکی آشنا میکند.
در سرتاسر کتاب R in Action، هدف، کاربرد عملی است – اینکه چگونه میتوانید دادههای خود را معنا کنید و این درک را به دیگران منتقل کنید. وقتی کار را تمام کردید، باید درک خوبی از نحوه کار R، کارهایی که میتواند انجام دهد و کجا میتوانید برای کسب اطلاعات بیشتر بروید، داشته باشید. شما میتوانید از تکنیکهای مختلفی برای تجسم دادهها استفاده کنید، و مهارتهایی برای مقابله با مشکلات اولیه و پیشرفته تحلیل دادهها دارید.
بیشتر بخوانید: کتاب Elixir in Action
موارد جدید در ویرایش سوم کتاب R in Action
تغییرات متعددی در ویرایش سوم وجود دارد، از جمله پوشش گستردهای از رویکردهای منظم برای مدیریت و تجزیه و تحلیل دادهها. در اینجا برخی از تغییرات قابل توجه تر آورده شده است.
فصل 2 (ایجاد یک مجموعه داده) اکنون شامل بستههای Reader، readxl و haven برای وارد کردن داده میشود. همچنین بخش جدیدی در مورد جدولها وجود دارد که یک به روز رسانی مدرن برای قاب داده است.
فصل 3 (مدیریت دادههای پایه) و 5 (مدیریت پیشرفته دادهها) شامل پوشش بستههای dplyr و tidyr برای مدیریت دادهها، تبدیل و خلاصه سازی است.
فصل 4 (شروع با نمودارها)، 6 (نمودارهای اساسی)، 11 (گرافهای متوسط) و 19 (گرافهای پیشرفته) جدید هستند و پوشش گستردهای از ggplot2 و پسوندهای آن ارائه میدهند.
فصل 16 (تحلیل خوشهای) گرافیک بهبود یافته و بخش جدیدی در ارزیابی خوشهبندی دادهها ارائه میدهد.
فصل 17 (طبقهبندی) بخش جدیدی در مورد استفاده از نمودارهای شکست و ارزشگذاری Shapley برای درک مدلهای جعبه سیاه دارد.
فصل 18 (روشهای پیشرفته برای دادههای از دست رفته) با بخشهای جدید درباره k-نزدیکترین همسایه و رویکردهای جنگل تصادفی برای انتساب مقادیر گمشده گسترش یافته است.
فصل 20 (برنامهنویسی پیشرفته) دارای بخشهای جدیدی در مورد ارزیابی غیر استاندارد و اشکالزدایی بصری است.
فصل 21 (ایجاد گزارشهای پویا) پوشش R Markdown و بخشهای جدید در مورد گزارشهای پارامتری و خطاهای رایج کدگذاری را گسترش داده است.
فصل 22 (ایجاد یک بسته) به طور کامل بازنویسی شده است تا استفاده از ابزارهای جدید برای ایجاد بسته ساده را در خود جای دهد. همچنین بخشهای جدیدی در مورد نحوه اشتراک گذاری و تبلیغ بستههای خود از طریق CRAN، GitHub و وبسایتهای تولید شده توسط نرمافزار وجود دارد.
پیوست A (رابط کاربری گرافیکی) برای منعکس کننده تغییرات سریع در این زمینه به روز شده است.
ضمیمه B (سفارشی کردن محیط راهاندازی) برای شامل روشهای جدید سفارشیسازی و حساسیت بیشتر نسبت به اثرات جانبی احتمالی در تحقیقات تکرارپذیر تجدید نظر شده است.
ضمیمه F (کار با مجموعه دادههای بزرگ) شامل بستههای جدید برای مجموعه دادههای بزرگتر از RAM، روشهای تحلیلی برای مشکلات اندازه ترابایت، و ادغام R با سرویسهای ابری است.
بخشهای جدیدی در مورد استفاده از RStudio برای برنامهنویسی، اشکالزدایی، گزارشنویسی و ایجاد بسته وجود دارد که در سراسر کتاب پراکنده شده است. در نهایت، به روز رسانیها و اصلاحات متعددی در سراسر متن انجام شده است.
چه کسی باید کتاب R in Action را بخواند؟
R in Action، نسخه سوم، باید برای هر کسی که با داده سروکار دارد جذاب باشد. هیچ پیشینهای در برنامهنویسی آماری یا زبان R فرض نمیشود. اگرچه این کتاب برای تازه کارها قابل دسترسی است، اما باید به اندازه کافی مطالب جدید و کاربردی وجود داشته باشد تا حتی افراد با تجربه R را راضی کند.
کاربران بدون پیشزمینه آماری که میخواهند از R برای دستکاری، خلاصه کردن و نمودار کردن دادهها استفاده کنند، باید فصلهای 1 تا 6، 11 و 19 را به راحتی در دسترس قرار دهند. فصل 7 و 10 یک دوره یک ترم در آمار را فرض میکند. و خوانندگان فصلهای 8، 9، و 12-18 از دو ترم آمار بهره مند خواهند شد. فصلهای 20 تا 22 به بررسی عمیقتر زبان R میپردازند و هیچ پیشنیاز آماری ندارند. من سعی کرده ام هر فصل را به گونه ای بنویسم که هم تحلیلگران دادههای مبتدی و هم متخصص، چیز جالب و مفیدی پیدا کنند.
نحوه سازماندهی این کتاب: نقشه راه
کتاب R in Action به گونه ای طراحی شده است که یک تور راهنما از پلتفرم R را با تمرکز بر روشهایی ارائه دهد که فوراً برای دستکاری، تجسم و درک دادهها قابل استفاده هستند. این کتاب دارای 22 فصل و در 5 بخش «شروع به کار»، «روشهای پایه»، «روشهای متوسط»، «روشهای پیشرفته» و «توسعه مهارتهای خود» است. موضوعات اضافی در هفت ضمیمه پوشش داده شده است.
فصل 1 کتاب R in Action با مقدمهای بر R و ویژگیهایی که آن را به عنوان یک پلت فرم تجزیه و تحلیل داده بسیار مفید میکند آغاز میشود. این فصل نحوه به دست آوردن برنامه و چگونگی بهبود نصب اولیه با برنامههای افزودنی که به صورت آنلاین در دسترس هستند را پوشش میدهد. بقیه فصل صرف کاوش در رابط کاربری و یادگیری نحوه اجرای اولین برنامههای شما میشود.
فصل 2 کتاب R in Action بسیاری از روشهای موجود برای وارد کردن دادهها به R را پوشش میدهد. نیمه اول فصل ساختارهای دادهای را که R برای نگهداری دادهها استفاده میکند، معرفی میکند. نیمه دوم روشهای وارد کردن دادهها به R از صفحهکلید، فایلهای متنی، صفحات وب، صفحات گسترده، بستههای آماری و پایگاههای داده را مورد بحث قرار میدهد.
فصل 3 کتاب R in Action مدیریت دادههای پایه را شامل مرتب سازی، ادغام، و زیرمجموعه مجموعههای داده و تبدیل، کدگذاری مجدد و حذف متغیرها میکند.
فصل 4 کتاب R in Action شما را با تجسم دادهها از طریق گرامر گرافیک آشنا میکند. روشهای ایجاد نمودارها، اصلاح آنها و ذخیره آنها در قالبهای مختلف را بررسی میکنیم.
بر اساس مطالب فصل 3، فصل 5، استفاده از توابع (ریاضی، آماری، کاراکتر) و ساختارهای کنترل (حلقه، اجرای مشروط) برای مدیریت دادهها را پوشش میدهد. سپس در مورد نحوه نوشتن توابع R خود و نحوه تغییر شکل و جمع آوری دادهها به روشهای مختلف بحث میکنیم.
فصل 6 کتاب R in Action روشهایی را برای ایجاد نمودارهای تک متغیره رایج، مانند نمودارهای میله ای، نمودار دایره ای، هیستوگرام، نمودار چگالی، نمودار جعبه، نقشه درختی، و نمودار نقطه ای نشان میدهد. هر کدام برای درک توزیع یک متغیر مفید است.
فصل 7 کتاب R in Action با نشان دادن نحوه خلاصه کردن دادهها، از جمله استفاده از آمار توصیفی و جداول متقابل شروع میشود. سپس به روشهای اساسی برای درک روابط بین دو متغیر، از جمله همبستگی، آزمون t، آزمونهای مجذور کای و روشهای ناپارامتریک نگاه میکنیم.
فصل 8 کتاب R in Action روشهای رگرسیون را برای مدل سازی رابطه بین یک متغیر نتیجه عددی و مجموعه ای از یک یا چند متغیر پیش بینی عددی معرفی میکند. روشهای برازش این مدلها، ارزیابی مناسب بودن و تفسیر معنای آنها به تفصیل مورد بحث قرار گرفتهاند.
فصل 9 کتاب R in Action تجزیه و تحلیل طرحهای تجربی پایه را از طریق تحلیل واریانس و انواع آن در نظر میگیرد. در اینجا، ما معمولاً علاقه مند هستیم که چگونه ترکیبات یا شرایط درمانی بر یک نتیجه عددی تأثیر میگذارد. روشهایی برای ارزیابی مناسب بودن تحلیلها و تجسم نتایج نیز پوشش داده شده است.
فصل 10 کتاب R in Action درمان مفصلی از تحلیل توان ارائه میدهد. با شروع بحث در مورد آزمایش فرضیه، این فصل بر چگونگی تعیین اندازه نمونه لازم برای تشخیص اثر درمانی یک اندازه معین با درجه اطمینان معین تمرکز میکند. این میتواند به شما در برنامهریزی مطالعات تجربی و شبه تجربی کمک کند که احتمالاً نتایج مفیدی به همراه دارد.
فصل 11 مطالب فصل 6 را گسترش میدهد و ایجاد نمودارهایی را پوشش میدهد که به شما کمک میکند روابط بین دو یا چند متغیر را تجسم کنید. اینها شامل انواع مختلف نمودارهای پراکندگی دوبعدی و سه بعدی، ماتریسهای نمودار پراکندگی، نمودارهای خطی، همبستگیها و نمودارهای موزاییکی میباشد.
فصل 12 کتاب R in Action روشهای تحلیلی را ارائه میکند که در مواردی که دادهها از توزیعهای ناشناخته یا مختلط نمونهبرداری میشوند، جایی که اندازه نمونه کوچک است، جایی که نقاط پرت یک مشکل هستند، یا در جایی که ابداع یک آزمون مناسب بر اساس توزیع نظری بسیار پیچیده و از نظر ریاضی غیرقابل حل است، به خوبی کار میکنند. آنها شامل هر دو روش نمونهبرداری مجدد و راهاندازی هستند – روشهای فشرده کامپیوتری که به راحتی در R پیادهسازی میشوند.
فصل 13 کتاب R in Action روشهای رگرسیون را در فصل 8 گسترش میدهد تا دادههایی را که به طور معمول توزیع نمیشوند پوشش دهد. این فصل با بحث در مورد مدلهای خطی تعمیمیافته شروع میشود و سپس بر مواردی تمرکز میکند که در آن شما سعی میکنید یک متغیر نتیجه را پیشبینی کنید که یا مقولهای است (رگرسیون لجستیک) یا تعداد (رگرسیون پواسون).
یکی از چالشهای مشکلات دادههای چند متغیره، ساده سازی است. فصل 14 روشهای تبدیل تعداد زیادی از متغیرهای همبسته به مجموعه کوچکتری از متغیرهای غیرهمبسته (تحلیل مؤلفههای اصلی)، و همچنین روشهایی برای کشف ساختار پنهان زیر مجموعهای از متغیرها (تحلیل عاملی) را توضیح میدهد. بسیاری از مراحل مربوط به یک تحلیل مناسب به تفصیل پوشش داده شده است.
فصل 15 روشهایی را برای ایجاد، دستکاری و مدلسازی دادههای سری زمانی تشریح میکند. این تجسم و تجزیه دادههای سری زمانی و همچنین رویکردهای نمایی و ARIMA برای پیش بینی مقادیر آینده را پوشش میدهد.
فصل 16 کتاب R in Action روشهای خوشهبندی مشاهدات را در گروههای طبیعی نشان میدهد. این فصل با بحث در مورد مراحل رایج در تجزیه و تحلیل خوشهای جامع آغاز میشود و سپس روشهای خوشهبندی سلسله مراتبی و تقسیمبندی ارائه میشود. چندین روش برای تعیین تعداد مناسب خوشهها ارائه شده است.
فصل 17 کتاب R in Action روشهای یادگیری ماشینی تحت نظارت رایج را برای طبقهبندی مشاهدات در گروهها ارائه میکند. درختان تصمیم، جنگلهای تصادفی و ماشینهای بردار پشتیبان به نوبه خود در نظر گرفته میشوند. همچنین با روشهایی برای ارزیابی دقت هر رویکرد آشنا خواهید شد. روشهای جدیدی برای درک نتایج ارائه شده است.
در راستای تلاش من برای ارائه روشهای عملی برای تجزیه و تحلیل دادهها، فصل 18 رویکردهای مدرن را برای مشکل فراگیر مقادیر داده از دست رفته در نظر میگیرد. R از تعدادی رویکرد ظریف برای تجزیه و تحلیل مجموعه دادههایی که ناقص هستند پشتیبانی میکند. چندین مورد از بهترینها در اینجا توضیح داده شده است، همراه با راهنماییهایی که برای اینکه چه زمانی باید استفاده کرد و از کدام یک اجتناب کرد.
فصل 19 کتاب R in Action بحث نمودارها را با نگاهی عمیق در سفارشی کردن محورها، طرح رنگ، فونتها، افسانهها، حاشیهنویسیها و منطقه طرح کامل میکند. شما یاد خواهید گرفت که چگونه چندین نمودار را در یک طرح واحد ترکیب کنید. در نهایت، یاد خواهید گرفت که چگونه یک نمودار استاتیک را به یک تجسم مبتنی بر وب تعاملی تبدیل کنید.
فصل 20 کتاب R in Action تکنیکهای برنامهنویسی پیشرفته را پوشش میدهد. شما در مورد تکنیکهای برنامهنویسی شیگرا و روشهای اشکالزدایی یاد خواهید گرفت. این فصل همچنین نکاتی را برای برنامهنویسی کارآمد ارائه میدهد. اگر به دنبال درک بیشتر از نحوه عملکرد R هستید، این فصل به ویژه مفید خواهد بود و پیش نیاز فصل 22 است.
فصل 21 کتاب R in Action چندین روش برای ایجاد گزارشهای جذاب از داخل R توضیح میدهد. شما یاد خواهید گرفت که چگونه صفحات وب، گزارشها، مقالات و حتی کتابها را از کد R خود تولید کنید. اسناد حاصل میتواند شامل کد، جداول نتایج، نمودارها و تفسیر شما باشد.
در نهایت، فصل 22 کتاب R in Action یک راهنمای گامبهگام برای ایجاد بستههای R ارائه میدهد. این به شما این امکان را میدهد که برنامههای پیچیدهتری ایجاد کنید، آنها را به طور موثر مستند کنید و آنها را با دیگران به اشتراک بگذارید. روشهای به اشتراک گذاری و تبلیغ بستههای شما به تفصیل مورد بحث قرار گرفته است.
پسگفتار شما را به بسیاری از بهترین سایتهای اینترنتی برای یادگیری بیشتر در مورد R، پیوستن به جامعه R، دریافت پاسخ به سؤالات، و در جریان ماندن با این محصول به سرعت در حال تغییر راهنمایی میکند.
آخرین، اما نه کم اهمیت، هفت ضمیمه (A تا G) پوشش متن را گسترش میدهند تا موضوعات مفیدی مانند رابطهای کاربری گرافیکی R، سفارشیسازی و ارتقاء یک نصب R، خروجی دادهها به برنامههای کاربردی دیگر، استفاده از R برای جبر ماتریس (à la MATLAB)، و کار با مجموعه دادههای بسیار بزرگ.
سرفصلهای کتاب R in Action:
- Copyright
- Praise for the previous edition of R in Action
- brief contents
- contents
- Front matter
- Part 1. Getting started
- 1 Introduction to R
- 2 Creating a dataset
- 3 Basic data management
- 4 Getting started with graphs
- 5 Advanced data management
- Part 2. Basic methods
- 6 Basic graphs
- 7 Basic statistics
- Part 3. Intermediate methods
- 8 Regression
- 9 Analysis of variance
- 10 Power analysis
- 11 Intermediate graphs
- 12 Resampling statistics and bootstrapping
- Part 4. Advanced methods
- 13 Generalized linear models
- 14 Principal components and factor analysis
- 15 Time series
- 16 Cluster analysis
- 17 Classification
- 18 Advanced methods for missing data
- Part 5. Expanding your skills
- 19 Advanced graphs
- 20 Advanced programming
- 21 Creating dynamic reports
- 22 Creating a package
- Afterword. Into the rabbit hole
- Appendix A. Graphical user interfaces
- Appendix B. Customizing the startup environment
- Appendix C. Exporting data from R
- Appendix D. Matrix algebra in R
- Appendix E. Packages used in this book
- Appendix F. Working with large datasets
- Appendix G. Updating an R installation
- References
- index
فایل کتاب R in Action را میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.