کتاب R for Data Science (R برای علم داده، وارد کردن، مرتب کردن، تبدیل، تجسم، و مدل دادهها، ویرایش دوم) از جدیدترین منابع حوزهی علوم داده است که مفاهیم علم داده را با استفاده از زبان برنامهنویسی قدرتمند R پیادهسازی و تشریح میکند.
در ادامه مقدمهای از کتاب R for Data Science را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب R for Data Science:
علم داده یک رشته هیجانانگیز است که به شما امکان میدهد دادههای خام را به درک، بینش و دانش تبدیل کنید. اهداف R for Data Science این است که به شما کمک کند مهمترین ابزارها را در R یاد بگیرید که به شما امکان میدهد علم داده را به طور کارآمد و قابل تکرار انجام دهید و در طول مسیر کمی سرگرم شوید! پس از خواندن این کتاب، ابزارهایی برای مقابله با طیف گستردهای از چالشهای علم داده با استفاده از بهترین بخشهای R خواهید داشت.
پیشگفتار چاپ دوم کتاب R for Data Science
به ویرایش دوم R for Data Science (R4DS) خوش آمدید! این یک بازسازی اساسی از نسخه اول است، مطالبی را که دیگر فکر نمیکنیم مفید باشند حذف میکند، مطالبی را اضافه میکند که آرزو میکنیم در نسخه اول گنجانده شود، و به طور کلی متن و کد را بهروزرسانی میکند تا تغییرات در بهترین شیوهها را منعکس کند. ما همچنین بسیار هیجانزده هستیم که به یکی از نویسندگان جدید خوش آمد میگوییم: Mine Çetinkaya-Rundel، یک مربی برجسته علم داده و یکی از همکاران ما در Posit (شرکتی که قبلاً به عنوان RStudio شناخته میشد).
خلاصهای کوتاه از بزرگترین تغییرات به شرح زیر است:
قسمت اول کتاب R for Data Science به «کل بازی» تغییر نام داده است. هدف این بخش این است که قبل از اینکه به جزئیات بپردازیم، جزئیات تقریبی «کل بازی» علم داده را به شما ارائه دهد.
بخش دوم کتاب «تجسم» است. این بخش به ابزارهای تجسم دادهها و بهترین شیوهها پوشش کامل تری نسبت به نسخه اول میدهد. بهترین مکان برای دریافت تمام جزئیات هنوز کتاب ggplot2 است، اما اکنون R4DS بیشتر از مهمترین تکنیکها را پوشش میدهد.
بخش سوم کتاب R for Data Science اکنون «تبدیل» نام دارد و فصلهای جدیدی در مورد اعداد، بردارهای منطقی و مقادیر گمشده به دست میآورد. اینها قبلاً بخشهایی از فصل تبدیل دادهها بودند، اما برای پوشش دادن همه جزئیات به فضای بیشتری نیاز داشتند.
قسمت چهارم کتاب «واردات» نام دارد. این مجموعه جدیدی از فصول است که فراتر از خواندن فایلهای متنی مسطح، کار با صفحات گسترده، گرفتن دادهها از پایگاههای داده، کار با دادههای بزرگ، مستطیل کردن دادههای سلسله مراتبی و حذف دادهها از وبسایتها است.
بخش “برنامه” باقیمانده است اما از بالا به پایین بازنویسی شده است تا بر مهمترین بخشهای نوشتن و تکرار تابع تمرکز کند. نوشتن توابع اکنون شامل جزئیاتی در مورد نحوه بستهبندی توابع مرتب و منظم (برخورد با چالشهای ارزیابی مرتب) است، زیرا این کار در چند سال اخیر بسیار آسان تر و مهم تر شده است. ما یک فصل جدید در مورد توابع مهم پایه R اضافه کردهایم که احتمالاً در کد R وحشی مشاهده خواهید کرد.
بخش “مدلسازی” حذف شده است. ما هرگز فضای کافی برای اجرای عدالت مدلینگ نداشتیم و اکنون منابع بسیار بهتری در دسترس است. ما به طور کلی توصیه میکنیم از بستههای tidymodels استفاده کنید و مدل سازی مرتب با R توسط Max Kuhn و Julia Silge (O’Reilly) را بخوانید.
بخش “ارتباط” باقی مانده است اما به طور کامل به روز شده است تا به جای R Markdown از Quarto استفاده کند. این نسخه از کتاب در Quarto نوشته شده است، و به وضوح ابزار آینده است.
سرفصلهای کتاب R for Data Science:
- Introduction
- I. Whole Game
- 1. Data Visualization
- 2. Workflow: Basics
- 3. Data Transformation
- 4. Workflow: Code Style
- 5. Data Tidying
- 6. Workflow: Scripts and Projects
- 7. Data Import
- 8. Workflow: Getting Help
- II. Visualize
- 9. Layers
- 10. Exploratory Data Analysis
- 11. Communication
- III. Transform
- 12. Logical Vectors
- 13. Numbers
- 14. Strings
- 15. Regular Expressions
- 16. Factors
- 17. Dates and Times
- 18. Missing Values
- 19. Joins
- IV. Import
- 20. Spreadsheets
- 21. Databases
- 22. Arrow
- 23. Hierarchical Data
- 24. Web Scraping
- V. Program
- 25. Functions
- 26. Iteration
- 27. A Field Guide to Base R
- VI. Communicate
- 28. Quarto
- 29. Quarto Formats
- Index
جهت دانلود کتاب R for Data Science میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.