کتاب Beginning Data Science in R 4

  • کتاب Beginning Data Science in R 4 نسخه دوم
کتاب Beginning Data Science in R 4 نسخه دوم

خرید کتاب Beginning Data Science in R 4:

۲۵,۰۰۰ تومان

  • نسخه کتاب فعلی به زبان لاتین می‌باشد.
  • کتاب به صورت فایل می‌باشد و پس از خرید بلافاصله در دسترس شما قرار می‌گیرد.
  • در صورت هرگونه سؤال با ایمیل و یا شماره پشتیبانی سایت در تماس باشید.

کتاب Beginning Data Science in R 4 (شروع علم داده در R 4: تجزیه و تحلیل داده‌ها، تجسم و مدل‌سازی برای دانشمند داده) مفاهیم علوم داده را با استفاده از زبان R نسخه 4 آموزش می‌دهد. این کتاب در 17 فصل به صورت کاملاً عملی و در دنیای واقعی مفاهیم مهم علوم داده را بیان خواهد کرد.

در ادامه مقدمه‌ای از کتاب Beginning Data Science in R 4 را از زبان نویسنده شرح خواهیم داد.

مقدمه‌ای بر کتاب Beginning Data Science in R 4:

به Beginning Data Science در R 4 خوش آمدید. من این کتاب را از مجموعه‌ای از یادداشت‌های سخنرانی برای دو کلاسی که چند سال قبل تدریس کردم نوشتم، «علم داده: تجسم و تجزیه و تحلیل» و «علم داده: توسعه و آزمایش نرم‌افزار». این کتاب به تناسب ساختار این کلاس‌ها نوشته شده است، جایی که هر کلاس شامل هفت هفته سخنرانی است که پس از آن کار پروژه ای انجام می‌شود. این بدان معنی است که نیمه اول کتاب Beginning Data Science in R 4 شامل هشت فصل با مواد اصلی است که هفت فصل اول بر تجزیه و تحلیل داده‌ها تمرکز دارد و فصل هشتم نمونه ای از پروژه تجزیه و تحلیل داده است.

فصل‌های تجزیه و تحلیل داده‌ها با هفت فصل در مورد توسعه نرم‌افزار قابل استفاده مجدد برای علم داده و سپس پروژه دوم که فصل‌های توسعه نرم‌افزار را به هم پیوند می‌دهد، دنبال می‌شود. در پایان کتاب Beginning Data Science in R 4، شما باید درک خوبی از اینکه علم داده چه می‌تواند باشد، هم به عنوان زمینه‌ای که آنالیز را پوشش می‌دهد و هم به عنوان توسعه روش‌های جدید و محصولات نرم‌افزاری قابل استفاده مجدد داشته باشید.

علم داده چیست؟

این سوال سختی است. نمی‌دانم یافتن کسی که کاملاً مطمئن باشد علم داده چیست یا نه آسان است یا نه، اما مطمئن هستم که پیدا کردن دو نفر بدون داشتن سه نظر در مورد آن دشوار است. بدون شک این یک کلمه پرطرفدار است و این روزها همه می‌خواهند دانشمندان داده را استخدام کنند، بنابراین داشتن مهارت‌های علم داده در CV مفید است. اما این چه چیزی هست؟

از آنجایی که نمی‌توانم تعریف مورد توافق را به شما ارائه کنم، فقط تعریف خودم را به شما می‌دهم: علم داده، علم یادگیری از داده‌ها است.

این تعریف بسیار گسترده است – تقریباً بیش از آن گسترده است که مفید باشد. من متوجه این موضوع هستم. اما پس از آن، من فکر می‌کنم علم داده یک زمینه فوق العاده کلی است. من با آن مشکلی ندارم. البته، شما می‌توانید استدلال کنید که هر علمی تماماً در مورد بدست آوردن اطلاعات از داده‌ها است و ممکن است حق با شما باشد.

با این حال، من می‌توانم بگویم که علم چیزی بیش از تبدیل داده‌های خام به اطلاعات مفید است. علوم بر پاسخ به سؤالات خاص در مورد جهان تمرکز می‌کنند، در حالی که علم داده بر چگونگی دستکاری داده‌ها به طور کارآمد و مؤثر متمرکز است. تمرکز اصلی این نیست که چه سوالاتی از داده‌ها بپرسیم، بلکه این است که چگونه می‌توانیم به آن‌ها پاسخ دهیم، هر چه که باشد. به این ترتیب بیشتر شبیه علوم کامپیوتر و ریاضیات است تا علوم طبیعی. آنقدرها در مورد مطالعه دنیای طبیعی نیست، بلکه به محاسبه کارآمد بر روی داده‌ها و یادگیری الگوهای از داده‌ها می‌پردازد.

در علم داده نیز طراحی آزمایش‌ها گنجانده شده است. با داده‌های مناسب، می‌توانیم به سوالاتی که به آن‌ها علاقه مندیم پاسخ دهیم. این می‌تواند با طراحی ضعیف آزمایش‌ها یا انتخاب ضعیف داده‌هایی که جمع آوری می‌کنیم دشوار باشد. طراحی مطالعه ممکن است حیاتی ترین جنبه علم داده باشد، اما موضوع این کتاب نیست. در کتاب Beginning Data Science in R 4، من بر تجزیه و تحلیل داده‌ها تمرکز می‌کنم، پس از جمع‌آوری.

علوم کامپیوتر عمدتاً مطالعه محاسبات است که در نام آن اشاره شده است، اما کمی گسترده‌تر است. همچنین در مورد نمایش و دستکاری داده‌ها است. نام “علوم کامپیوتر” بر محاسبات تمرکز دارد، در حالی که “علم داده” بر داده‌ها تأکید دارد. اما البته، زمینه‌ها همپوشانی دارند. اگر در حال نوشتن یک الگوریتم مرتب‌سازی هستید، روی محاسبات تمرکز می‌کنید یا داده‌ها؟ آیا این حتی یک سوال معنادار برای پرسیدن است؟

همپوشانی قابل توجهی بین علوم کامپیوتر و علم داده وجود دارد و طبیعتاً مجموعه مهارت‌هایی که شما به آن نیاز دارید نیز همپوشانی دارند. برای دستکاری کارآمد داده‌ها، به ابزارهایی برای انجام این کار نیاز دارید، بنابراین مهارت‌های برنامه‌نویسی رایانه ضروری است، و معمولاً دانشی در مورد الگوریتم‌ها و ساختارهای داده نیز وجود دارد. با این حال، برای علم داده، تمرکز همیشه بر روی داده‌ها است.

یک پروژه تجزیه و تحلیل داده بر چگونگی جریان داده‌ها از شکل خام خود از طریق دستکاری‌های مختلف تا زمانی که به روشی مفید خلاصه شود، تمرکز می‌کند. اگرچه این تفاوت می‌تواند ظریف باشد، اما تمرکز بر روی عملیاتی که یک برنامه در طول تجزیه و تحلیل انجام می‌دهد نیست، بلکه تمرکز بر این است که چگونه داده‌ها جریان یافته و تبدیل می‌شوند.

همچنین بر این تمرکز می‌شود که چرا ما تبدیل‌های داده‌ای خاص را انجام می‌دهیم، این تغییرات به چه منظوری خدمت می‌کنند، و چگونه به ما کمک می‌کنند تا در مورد داده‌ها دانش کسب کنیم. به همان اندازه که تصمیم می‌گیریم با داده‌ها چه کاری انجام دهیم، به نحوه انجام کارآمد آن بستگی دارد.

البته آمار نیز ارتباط نزدیکی با علم داده دارد. به قدری به هم مرتبط هستند که بسیاری علم داده را چیزی بیش از یک کلمه فانتزی برای آمار می‌دانند که کمی مدرن تر و جذاب تر به نظر می‌رسد. نمی‌توانم بگویم که به شدت با این مخالفم – علم داده از آمار داغ تر به نظر می‌رسد – اما همانطور که علم داده اندکی با علم کامپیوتر متفاوت است، علم داده نیز تا حدودی با آمار متفاوت است. فقط، شاید، تا حدودی کمتر از علوم کامپیوتر است.

بخش بزرگی از انجام آمار، ساخت مدل‌های ریاضی برای داده‌های شما و تطبیق مدل‌ها با داده‌ها برای یادگیری در مورد داده‌ها از این طریق است. این همان کاری است که ما در علم داده انجام می‌دهیم. تا زمانی که تمرکز روی داده‌ها باشد، من خوشحالم که آمار را علم داده می‌نامم. اما فرض کنید تمرکز روی مدل‌ها و ریاضیات تغییر کند. در آن صورت، ما از علم داده دور می‌شویم و به چیز دیگری می‌رویم – درست مثل اینکه تمرکز از داده‌ها به محاسبات تغییر می‌کند، ما از علم داده به علم کامپیوتر دور می‌شویم.

علم داده همچنین با یادگیری ماشین و هوش مصنوعی مرتبط است – و باز هم، همپوشانی‌های بزرگی وجود دارد. شاید تعجب آور نباشد زیرا چیزی مانند یادگیری ماشینی هم در علم کامپیوتر و هم در آمار خانه خود را دارد. اگر بر تجزیه و تحلیل داده‌ها تمرکز کند، در علم داده نیز در خانه است. صادقانه بگویم، هرگز برای من مشخص نبود که یک مدل ریاضی از یک مدل آماری ساده قدیمی به یادگیری ماشینی تبدیل شود.

برای این کتاب، ما فقط با تعریف من پیش می‌رویم، و تا زمانی که روی تجزیه و تحلیل داده‌ها تمرکز می‌کنیم، آن را علم داده می‌نامیم.

پیش نیازهای خواندن کتاب Beginning Data Science in R 4

برای هشت فصل اول این کتاب، تمرکز بر تجزیه و تحلیل داده‌ها است نه برنامه‌نویسی. برای آن هشت فصل، آشنایی دقیقی با طراحی نرم‌افزار، الگوریتم‌ها، ساختار داده‌ها و غیره نمی‌دانم. انتظار ندارم که شما هم تجربه‌ای با زبان برنامه‌نویسی R داشته باشید. با این حال، من فرض می‌کنم که شما تجربه ای در زمینه برنامه‌نویسی، مدل سازی ریاضی و آمار داشته‌اید.

اگر با زبان‌های اسکریپت‌نویسی یا زبان‌های شی‌گرا آشنایی داشته باشید، برنامه‌نویسی R می‌تواند گاهی بسیار مشکل باشد. R یک زبان کاربردی است که به شما اجازه تغییر داده‌ها را نمی‌دهد. در حالی که دارای سیستم‌هایی برای برنامه‌نویسی شی گرا است، این پارادایم برنامه‌نویسی را بسیار متفاوت از زبان‌هایی که احتمالاً دیده اید، مانند جاوا یا پایتون، مدیریت می‌کند.

برای بخش تجزیه و تحلیل داده‌های کتاب Beginning Data Science in R 4، هشت فصل اول، ما فقط از R برای کارهای برنامه‌نویسی بسیار ساده استفاده می‌کنیم، بنابراین هیچ یک از این‌ها نباید مشکلی ایجاد کند.

ما باید اسکریپت‌های ساده ای برای دستکاری و خلاصه کردن داده‌ها بنویسیم، بنابراین شما باید با نحوه نوشتن عبارات اساسی مانند فراخوانی تابع، if، حلقه‌ها و مواردی از این قبیل آشنا باشید. من هر ساختاری از این قبیل را در کتاب معرفی می‌کنم که به آن‌ها نیاز داشته باشیم تا ببینیم چگونه به زبان R نوشته شده‌اند، اما وقت زیادی برای توضیح آن‌ها صرف نمی‌کنم. بیشتر، من از شما انتظار دارم که بتوانید آن را از نمونه‌ها انتخاب کنید.

به طور مشابه، من انتظار ندارم که شما قبلاً بدانید که چگونه داده‌ها را برازش کنید و مدل‌ها را در R مقایسه کنید. من فرض می‌کنم که شما به اندازه کافی مقدمه آمار را داشته اید تا با عبارات اساسی مانند تخمین پارامتر، برازش مدل، متغیرهای توضیحی و پاسخ، و مقایسه مدل در غیر این صورت، من از شما انتظار دارم که حداقل بتوانید در مواقعی که نیاز دارید، آنچه را که در مورد آن صحبت می‌کنیم، انتخاب کنید.

من انتظار ندارم که شما اطلاعات زیادی در مورد آمار و برنامه‌نویسی داشته باشید، اما این “علم داده برای آدمک‌ها” نیست، بنابراین من از شما انتظار دارم بدون اینکه من همه چیز را با جزئیات توضیح دهم، مثال‌هایی را بیابید.

پس از هفت فصل اول کتاب Beginning Data Science in R 4، شرح کوتاهی از پروژه تجزیه و تحلیل داده‌ها است که یکی از دانش‌آموزانم اولین‌باری که آن را برگزار کردم برای کلاس من انجام داد. این نشان می‌دهد که چنین پروژه‌ای چگونه می‌تواند به نظر برسد، اما من به شما پیشنهاد می‌کنم که تا پایان هفت فصل اول صبر نکنید تا خودتان شروع به انجام چنین تحلیلی کنید.

برای اینکه از خواندن کتاب Beginning Data Science in R 4 بیشترین بهره را ببرید، باید به طور مداوم آنچه را که یاد می‌گیرید به کار ببرید. از قبل وقتی شروع به خواندن می‌کنید، پیشنهاد می‌کنم مجموعه داده ای را بیابید که علاقه‌مند به کسب اطلاعات بیشتر در مورد آن هستید و سپس آنچه را که در هر فصل می‌آموزید در آن داده‌ها اعمال کنید.

برای هشت فصل بعدی کتاب Beginning Data Science in R 4، تمرکز بر برنامه‌نویسی است. برای خواندن این بخش، باید با برنامه‌نویسی شی گرا آشنا باشید—من توضیح خواهم داد که چگونه آن را در R مدیریت می‌کنیم و تفاوت آن با زبان‌هایی مانند پایتون، جاوا یا C++ چیست.

با این حال، من انتظار دارم که شما با اصطلاحاتی مانند سلسله مراتب کلاس، وراثت و روش‌های چند شکلی آشنا باشید. من از شما انتظار ندارم که از قبل با برنامه‌نویسی تابعی آشنا باشید (اما اگر آشنا هستید، اگر از قبل با برنامه‌نویسی R آشنا نیستید، هنوز چیزهای زیادی برای یادگیری در آن فصل وجود خواهد داشت). فصل آخر یک شرح دیگر پروژه است.

برای کتاب برنامه‌ریزی کنید

در کتاب Beginning Data Science in R 4، دستکاری داده‌ها را پوشش خواهیم داد:

فیلتر کردن و انتخاب داده‌های مربوطه

تبدیل داده‌ها به اشکالی که به راحتی قابل تجزیه و تحلیل هستند

جمع بندی داده‌ها

تجسم داده‌ها به روش‌های آموزنده هم برای کاوش داده‌ها و هم برای ارائه نتایج

ساختمان نمونه

این‌ها جنبه‌های حیاتی انجام تحلیل در علم داده است. پس از این، نحوه توسعه کد R که قابل استفاده مجدد است و به خوبی با بسته‌های موجود کار می‌کند و به راحتی قابل گسترش است را توضیح می‌دهیم و خواهیم دید که چگونه بسته‌های R جدید بسازیم که افراد دیگر بتوانند در پروژه‌های خود استفاده کنند. این‌ها مهارت‌های ضروری هستند که شما برای توسعه روش‌های خود و به اشتراک گذاری آن‌ها با جهان نیاز دارید.

R یکی از محبوب ترین (و منبع باز) زبان‌های برنامه‌نویسی تجزیه و تحلیل داده‌ها در حال حاضر است. البته محبوبیت به معنای کیفیت نیست. با این حال، از آنجایی که R بسیار محبوب است، دارای یک اکوسیستم غنی از برنامه‌های افزودنی است (به نام «بسته‌ها» در R) تقریباً برای هر نوع تحلیلی که می‌توانید به آن علاقه‌مند باشید.

افرادی که روش‌های آماری را توسعه می‌دهند اغلب آن‌ها را به عنوان بسته‌های R پیاده‌سازی می‌کنند، بنابراین شما معمولاً می‌توانید تکنیک‌های پیشرفته را در R به راحتی دریافت کنید. محبوبیت همچنین به این معنی است که جامعه بزرگی از مردم وجود دارد که در صورت بروز مشکل می‌توانند به شما کمک کنند. اکثر مشکلاتی که با آن مواجه می‌شوید را می‌توان با چند دقیقه در Google یا Stack Overflow حل کرد زیرا بعید است اولین کسی باشید که با مشکل خاصی مواجه می‌شوید. همچنین آموزش‌های آنلاین زیادی برای کسب اطلاعات بیشتر در مورد R و بسته‌های تخصصی وجود دارد. و اگر می‌خواهید بیشتر بدانید، کتاب‌های زیادی وجود دارد که می‌توانید بخرید.

تجزیه و تحلیل داده‌ها و تجسم

موضوعات تمرکز بر تجزیه و تحلیل داده‌ها و تجسم در هشت فصل اول:

1. مقدمه ای بر برنامه‌نویسی R: در این فصل از کتاب Beginning Data Science in R 4 نحوه کار با داده‌ها و نوشتن خطوط لوله داده را یاد می‌گیریم.

2. تجزیه و تحلیل تکرارپذیر: در این فصل از کتاب Beginning Data Science in R 4، نحوه ادغام اسناد و تجزیه و تحلیل در یک سند واحد و نحوه استفاده از چنین اسنادی برای تولید تحقیقات تکرارپذیر را درمی‌یابیم.

3. دستکاری داده‌ها: در این فصل از کتاب Beginning Data Science in R 4، نحوه وارد کردن داده‌ها، مرتب کردن داده‌ها، تبدیل و محاسبه خلاصه‌ها از داده‌ها را می‌آموزیم.

4. تجسم داده‌ها: در این فصل از کتاب Beginning Data Science in R 4، ما یاد می‌گیریم که چگونه نمودارهایی برای کاوش ویژگی‌های داده و ارائه ویژگی‌های داده و نتایج تجزیه و تحلیل ایجاد کنیم.

5. کار با مجموعه داده‌های بزرگ: در این فصل از کتاب Beginning Data Science in R 4، نحوه برخورد با داده‌ها را می‌بینیم که در آن تعداد مشاهدات، رویکردهای معمول ما را بسیار کند می‌کند.

6. یادگیری نظارت شده: در این فصل از کتاب Beginning Data Science in R 4، نحوه آموزش مدل‌ها را زمانی که مجموعه داده‌هایی با کلاس‌های شناخته شده یا مقادیر رگرسیون داریم، یاد می‌گیریم.

7. یادگیری بدون نظارت: در این فصل از کتاب Beginning Data Science in R 4 می‌آموزیم که چگونه الگوهایی را که در داده‌ها از آن‌ها آگاه نیستیم جستجو کنیم.

8. پروژه 1: ضربه زدن به بطری: پس از این فصل‌ها، اولین پروژه، تجزیه و تحلیل ویژگی‌های فیزیکوشیمیایی شراب است، که در آن تکنیک‌های مختلف در حال استفاده را می‌بینیم.

توسعه نرم‌افزار

نه فصل بعدی کتاب Beginning Data Science in R 4 توسعه نرم‌افزار و بسته را پوشش می‌دهد:

1. عمیق تر در برنامه‌نویسی R: در این فصل از کتاب Beginning Data Science in R 4، ویژگی‌های پیشرفته‌تر زبان برنامه‌نویسی R را بررسی می‌کنیم.

2. کار با بردارها و لیست‌ها: در این فصل از کتاب Beginning Data Science in R 4، دو ساختار داده ضروری، یعنی بردارها و لیست‌ها را بررسی می‌کنیم.

3. برنامه‌نویسی تابعی: در این فصل از کتاب Beginning Data Science in R 4، یک ویژگی پیشرفته زبان برنامه‌نویسی R، یعنی برنامه‌نویسی تابعی را بررسی می‌کنیم.

4. برنامه‌نویسی شی گرا: در این فصل از کتاب Beginning Data Science in R 4 می‌آموزیم که چگونه R شی‌گرا را مدیریت می‌کند و چگونه می‌توانیم از آن برای نوشتن کدهای عمومی‌تر استفاده کنیم.

5. ساختن یک بسته R: در این فصل از کتاب Beginning Data Science in R 4، اجزای ضروری یک بسته R و نحوه برنامه‌نویسی خود را یاد می‌گیریم.

6. تست و بررسی بسته بندی: در این فصل از کتاب Beginning Data Science in R 4، تکنیک‌هایی را برای آزمایش کد R و بررسی سازگاری بسته‌های R خود یاد می‌گیریم.

7. کنترل نسخه: در این فصل از کتاب Beginning Data Science in R 4، نحوه مدیریت کد تحت کنترل نسخه و نحوه همکاری با استفاده از GitHub را می‌آموزیم.

8. نمایه‌سازی و بهینه‌سازی: در این فصل از کتاب Beginning Data Science in R 4، ما یاد می‌گیریم که چگونه نقاط مهم کد را که در آن راه حل‌های ناکارآمد سرعت ما را کند می‌کنند و تکنیک‌هایی برای کاهش آن شناسایی کنیم.

9. پروژه 2: رگرسیون خطی بیزی: در فصل آخر کتاب Beginning Data Science in R 4 به پروژه دوم می‌رسیم که در آن بسته ای برای رگرسیون خطی بیزی می‌سازیم.

گرفتن R و RStudio

برای انجام تمرینات کتاب Beginning Data Science in R 4 باید R را روی کامپیوتر خود نصب کنید. من به شما پیشنهاد می‌کنم که یک محیط یکپارچه داشته باشید زیرا زمانی که نقشه‌ها، اسناد، کدها و غیره خود را در یک برنامه دارید، پیگیری پروژه کمی آسان‌تر است.

من از RStudio (www.rstudio.com/products/RStudio) استفاده می‌کنم که به گرمی توصیه می‌کنم. شما می‌توانید آن را به صورت رایگان دریافت کنید – فقط پیوند را دنبال کنید – و من فرض می‌کنم که آن را دارید زمانی که لازم باشد در فصل‌های بعدی کتاب Beginning Data Science in R 4 به محیط نرم‌افزاری که استفاده می‌کنید مراجعه کنم. اگرچه RStudio خاصی وجود نخواهد داشت و اکثر ابزارهای کار با R عمدتاً ویژگی‌های مشابهی دارند، بنابراین اگر می‌خواهید از چیز دیگری استفاده کنید، احتمالاً می‌توانید یادداشت‌ها را بدون هیچ مشکلی دنبال کنید.

پروژه‌ها

شما نمی‌توانید نحوه تجزیه و تحلیل داده‌ها را بدون تجزیه و تحلیل داده‌ها یاد بگیرید و همچنین نمی‌توانید نحوه توسعه نرم‌افزار را بدون توسعه نرم‌افزار درک کنید. تایپ کردن نمونه‌هایی از کتاب به هیچ وجه مانند نوشتن کد به تنهایی نیست. حتی انجام تمرین‌هایی از کتاب – که واقعاً باید انجام دهید – با کار کردن روی پروژه‌های خودتان یکسان نیست.

به هر حال، تمرین‌ها جنبه‌های جزئی جدا شده از مشکلاتی را که به تازگی با آن‌ها آشنا شده‌اید پوشش می‌دهند. قبل از هر کاری که در دنیای واقعی باید با آن سر و کار داشته باشید، فصلی از مطالب ارائه نشده است. باید خودتان مشخص کنید که چه کاری و چگونه باید انجام شود. اگر فقط تمرین‌های این کتاب را انجام دهید، مهم ترین درس در تجزیه و تحلیل داده‌ها را از دست خواهید داد:

چگونه داده‌ها را کاوش کنیم و نسبت به آن احساسی داشته باشیم

نحوه انجام کارآگاهی لازم برای به دست آوردن درک از داده‌ها

چگونه با تمام نویزها و موارد عجیب و غریب موجود در هر مجموعه داده مقابله کنیم

و برای توسعه یک بسته، باید به نحوه طراحی و اجرای عملکرد آن فکر کنید تا توابع مختلف و ساختارهای داده به خوبی با هم تطابق داشته باشند.

من از طریق یک پروژه تجزیه و تحلیل داده‌ها به شما نشان خواهم داد که در کتاب Beginning Data Science in R 4 چگونه می‌تواند باشد. برای یادگیری نحوه تجزیه و تحلیل داده‌ها به تنهایی، باید خودتان نیز این کار را انجام دهید – و باید آن را با مجموعه داده ای که من برای شما کاوش نکرده ام انجام دهید. ممکن است مجموعه داده ای داشته باشید که قبلاً روی آن کار کرده اید، مجموعه داده ای از چیزی که فقط به آن علاقه دارید، یا احتمالاً می‌توانید چیز جالبی در یک مخزن داده‌های عمومی پیدا کنید، برای مثال، یکی از این موارد:

RDataMining.com: www.rdatamining.com/resources/data

مخزن یادگیری ماشین UCI: http://archive.ics.uci.edu/ml/

KDNuggets: www.kdnuggets.com/datasets/index.html

مجموعه داده‌های Reddit R: www.reddit.com/r/datasets

مجموعه داده‌های عمومی عالی GitHub: https://github.com/caesar0301/awesome-public-datasets

پیشنهاد می‌کنم برای خود مجموعه داده‌ای پیدا کنید و بعد از هر درس از مهارت‌هایی که آموخته‌اید برای کشف این مجموعه داده استفاده کنید. داده‌هایی را که به صورت جدول ساخته شده‌اند با مشاهدات به عنوان ردیف و متغیرها به عنوان ستون انتخاب کنید زیرا این شکل داده‌هایی است که در کتاب Beginning Data Science in R 4 در نظر خواهیم گرفت.

در پایان هشت فصل اول، این داده‌ها را تجزیه و تحلیل خواهید کرد. شما می‌توانید گزارشی در مورد تحلیل خود بنویسید که دیگران بتوانند آن را ارزیابی کنند تا آن را دنبال کنند و شاید آن را اصلاح کنند: شما در حال انجام علم تکرارپذیر هستید.

برای موضوعات برنامه‌نویسی، پروژه دیگری را توضیح خواهم داد که مسائل طراحی و پیاده‌سازی مربوط به ساخت یک بسته R را نشان می‌دهد. در آنجا، شما باید بتوانید از اجرای نسخه شخصی خود از پروژه‌ای که من استفاده می‌کنم یاد بگیرید، اما مطمئناً با کار بر روی یک پروژه بدون هیچ کمکی، بیشتر با چالش مواجه خواهید شد. هر کاری که انجام می‌دهید، برای بهره‌مندی کامل از این کتاب، باید در حین خواندن فصل‌های برنامه‌نویسی، بسته خود را بسازید.

سرفصل‌های کتاب Beginning Data Science in R 4:

  • About the Author
  • About the Technical Reviewer
  • Acknowledgments
  • Introduction
  • Chapter 1: Introduction to R Programming
  • Chapter 2: Reproducible Analysis
  • Chapter 3: Data Manipulation
  • Chapter 4: Visualizing Data
  • Chapter 5: Working with Large Data Sets
  • Chapter 6: Supervised Learning
  • Chapter 7: Unsupervised Learning
  • Chapter 8: Project 1: Hitting the Bottle
  • Chapter 9: Deeper into R Programming
  • Chapter 10: Working with Vectors and Lists
  • Chapter 11: Functional Programming
  • Chapter 12: Object-Oriented Programming
  • Chapter 13: Building an R Package
  • Chapter 14: Testing and Package Checking
  • Chapter 15: Version Control
  • Chapter 16: Profiling and Optimizing
  • Chapter 17: Project 2: Bayesian Linear Regression
  • Conclusions
  • Index

جهت دانلود کتاب Beginning Data Science in R 4 می‌توانید پس از پرداخت، دریافت کنید.

فرمت کتاب

PDF

ویرایش

Second

ISBN

978-1-4842-8155-0

تعداد صفحات

528

انتشارات

سال انتشار

حجم

11.19 مگابایت

نویسنده

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “کتاب Beginning Data Science in R 4”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خرید کتاب Beginning Data Science in R 4:

۲۵,۰۰۰ تومان

  • نسخه کتاب فعلی به زبان لاتین می‌باشد.
  • کتاب به صورت فایل می‌باشد و پس از خرید بلافاصله در دسترس شما قرار می‌گیرد.
  • در صورت هرگونه سؤال با ایمیل و یا شماره پشتیبانی سایت در تماس باشید.
دسته‌یندی کتاب‌ها:
سبد خرید
به بالا بروید