کتاب Beginning Data Science in R 4 (شروع علم داده در R 4: تجزیه و تحلیل دادهها، تجسم و مدلسازی برای دانشمند داده) مفاهیم علوم داده را با استفاده از زبان R نسخه 4 آموزش میدهد. این کتاب در 17 فصل به صورت کاملاً عملی و در دنیای واقعی مفاهیم مهم علوم داده را بیان خواهد کرد.
در ادامه مقدمهای از کتاب Beginning Data Science in R 4 را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Beginning Data Science in R 4:
به Beginning Data Science در R 4 خوش آمدید. من این کتاب را از مجموعهای از یادداشتهای سخنرانی برای دو کلاسی که چند سال قبل تدریس کردم نوشتم، «علم داده: تجسم و تجزیه و تحلیل» و «علم داده: توسعه و آزمایش نرمافزار». این کتاب به تناسب ساختار این کلاسها نوشته شده است، جایی که هر کلاس شامل هفت هفته سخنرانی است که پس از آن کار پروژه ای انجام میشود. این بدان معنی است که نیمه اول کتاب Beginning Data Science in R 4 شامل هشت فصل با مواد اصلی است که هفت فصل اول بر تجزیه و تحلیل دادهها تمرکز دارد و فصل هشتم نمونه ای از پروژه تجزیه و تحلیل داده است.
فصلهای تجزیه و تحلیل دادهها با هفت فصل در مورد توسعه نرمافزار قابل استفاده مجدد برای علم داده و سپس پروژه دوم که فصلهای توسعه نرمافزار را به هم پیوند میدهد، دنبال میشود. در پایان کتاب Beginning Data Science in R 4، شما باید درک خوبی از اینکه علم داده چه میتواند باشد، هم به عنوان زمینهای که آنالیز را پوشش میدهد و هم به عنوان توسعه روشهای جدید و محصولات نرمافزاری قابل استفاده مجدد داشته باشید.
علم داده چیست؟
این سوال سختی است. نمیدانم یافتن کسی که کاملاً مطمئن باشد علم داده چیست یا نه آسان است یا نه، اما مطمئن هستم که پیدا کردن دو نفر بدون داشتن سه نظر در مورد آن دشوار است. بدون شک این یک کلمه پرطرفدار است و این روزها همه میخواهند دانشمندان داده را استخدام کنند، بنابراین داشتن مهارتهای علم داده در CV مفید است. اما این چه چیزی هست؟
از آنجایی که نمیتوانم تعریف مورد توافق را به شما ارائه کنم، فقط تعریف خودم را به شما میدهم: علم داده، علم یادگیری از دادهها است.
این تعریف بسیار گسترده است – تقریباً بیش از آن گسترده است که مفید باشد. من متوجه این موضوع هستم. اما پس از آن، من فکر میکنم علم داده یک زمینه فوق العاده کلی است. من با آن مشکلی ندارم. البته، شما میتوانید استدلال کنید که هر علمی تماماً در مورد بدست آوردن اطلاعات از دادهها است و ممکن است حق با شما باشد.
با این حال، من میتوانم بگویم که علم چیزی بیش از تبدیل دادههای خام به اطلاعات مفید است. علوم بر پاسخ به سؤالات خاص در مورد جهان تمرکز میکنند، در حالی که علم داده بر چگونگی دستکاری دادهها به طور کارآمد و مؤثر متمرکز است. تمرکز اصلی این نیست که چه سوالاتی از دادهها بپرسیم، بلکه این است که چگونه میتوانیم به آنها پاسخ دهیم، هر چه که باشد. به این ترتیب بیشتر شبیه علوم کامپیوتر و ریاضیات است تا علوم طبیعی. آنقدرها در مورد مطالعه دنیای طبیعی نیست، بلکه به محاسبه کارآمد بر روی دادهها و یادگیری الگوهای از دادهها میپردازد.
در علم داده نیز طراحی آزمایشها گنجانده شده است. با دادههای مناسب، میتوانیم به سوالاتی که به آنها علاقه مندیم پاسخ دهیم. این میتواند با طراحی ضعیف آزمایشها یا انتخاب ضعیف دادههایی که جمع آوری میکنیم دشوار باشد. طراحی مطالعه ممکن است حیاتی ترین جنبه علم داده باشد، اما موضوع این کتاب نیست. در کتاب Beginning Data Science in R 4، من بر تجزیه و تحلیل دادهها تمرکز میکنم، پس از جمعآوری.
علوم کامپیوتر عمدتاً مطالعه محاسبات است که در نام آن اشاره شده است، اما کمی گستردهتر است. همچنین در مورد نمایش و دستکاری دادهها است. نام “علوم کامپیوتر” بر محاسبات تمرکز دارد، در حالی که “علم داده” بر دادهها تأکید دارد. اما البته، زمینهها همپوشانی دارند. اگر در حال نوشتن یک الگوریتم مرتبسازی هستید، روی محاسبات تمرکز میکنید یا دادهها؟ آیا این حتی یک سوال معنادار برای پرسیدن است؟
همپوشانی قابل توجهی بین علوم کامپیوتر و علم داده وجود دارد و طبیعتاً مجموعه مهارتهایی که شما به آن نیاز دارید نیز همپوشانی دارند. برای دستکاری کارآمد دادهها، به ابزارهایی برای انجام این کار نیاز دارید، بنابراین مهارتهای برنامهنویسی رایانه ضروری است، و معمولاً دانشی در مورد الگوریتمها و ساختارهای داده نیز وجود دارد. با این حال، برای علم داده، تمرکز همیشه بر روی دادهها است.
یک پروژه تجزیه و تحلیل داده بر چگونگی جریان دادهها از شکل خام خود از طریق دستکاریهای مختلف تا زمانی که به روشی مفید خلاصه شود، تمرکز میکند. اگرچه این تفاوت میتواند ظریف باشد، اما تمرکز بر روی عملیاتی که یک برنامه در طول تجزیه و تحلیل انجام میدهد نیست، بلکه تمرکز بر این است که چگونه دادهها جریان یافته و تبدیل میشوند.
همچنین بر این تمرکز میشود که چرا ما تبدیلهای دادهای خاص را انجام میدهیم، این تغییرات به چه منظوری خدمت میکنند، و چگونه به ما کمک میکنند تا در مورد دادهها دانش کسب کنیم. به همان اندازه که تصمیم میگیریم با دادهها چه کاری انجام دهیم، به نحوه انجام کارآمد آن بستگی دارد.
البته آمار نیز ارتباط نزدیکی با علم داده دارد. به قدری به هم مرتبط هستند که بسیاری علم داده را چیزی بیش از یک کلمه فانتزی برای آمار میدانند که کمی مدرن تر و جذاب تر به نظر میرسد. نمیتوانم بگویم که به شدت با این مخالفم – علم داده از آمار داغ تر به نظر میرسد – اما همانطور که علم داده اندکی با علم کامپیوتر متفاوت است، علم داده نیز تا حدودی با آمار متفاوت است. فقط، شاید، تا حدودی کمتر از علوم کامپیوتر است.
بخش بزرگی از انجام آمار، ساخت مدلهای ریاضی برای دادههای شما و تطبیق مدلها با دادهها برای یادگیری در مورد دادهها از این طریق است. این همان کاری است که ما در علم داده انجام میدهیم. تا زمانی که تمرکز روی دادهها باشد، من خوشحالم که آمار را علم داده مینامم. اما فرض کنید تمرکز روی مدلها و ریاضیات تغییر کند. در آن صورت، ما از علم داده دور میشویم و به چیز دیگری میرویم – درست مثل اینکه تمرکز از دادهها به محاسبات تغییر میکند، ما از علم داده به علم کامپیوتر دور میشویم.
علم داده همچنین با یادگیری ماشین و هوش مصنوعی مرتبط است – و باز هم، همپوشانیهای بزرگی وجود دارد. شاید تعجب آور نباشد زیرا چیزی مانند یادگیری ماشینی هم در علم کامپیوتر و هم در آمار خانه خود را دارد. اگر بر تجزیه و تحلیل دادهها تمرکز کند، در علم داده نیز در خانه است. صادقانه بگویم، هرگز برای من مشخص نبود که یک مدل ریاضی از یک مدل آماری ساده قدیمی به یادگیری ماشینی تبدیل شود.
برای این کتاب، ما فقط با تعریف من پیش میرویم، و تا زمانی که روی تجزیه و تحلیل دادهها تمرکز میکنیم، آن را علم داده مینامیم.
پیش نیازهای خواندن کتاب Beginning Data Science in R 4
برای هشت فصل اول این کتاب، تمرکز بر تجزیه و تحلیل دادهها است نه برنامهنویسی. برای آن هشت فصل، آشنایی دقیقی با طراحی نرمافزار، الگوریتمها، ساختار دادهها و غیره نمیدانم. انتظار ندارم که شما هم تجربهای با زبان برنامهنویسی R داشته باشید. با این حال، من فرض میکنم که شما تجربه ای در زمینه برنامهنویسی، مدل سازی ریاضی و آمار داشتهاید.
اگر با زبانهای اسکریپتنویسی یا زبانهای شیگرا آشنایی داشته باشید، برنامهنویسی R میتواند گاهی بسیار مشکل باشد. R یک زبان کاربردی است که به شما اجازه تغییر دادهها را نمیدهد. در حالی که دارای سیستمهایی برای برنامهنویسی شی گرا است، این پارادایم برنامهنویسی را بسیار متفاوت از زبانهایی که احتمالاً دیده اید، مانند جاوا یا پایتون، مدیریت میکند.
برای بخش تجزیه و تحلیل دادههای کتاب Beginning Data Science in R 4، هشت فصل اول، ما فقط از R برای کارهای برنامهنویسی بسیار ساده استفاده میکنیم، بنابراین هیچ یک از اینها نباید مشکلی ایجاد کند.
ما باید اسکریپتهای ساده ای برای دستکاری و خلاصه کردن دادهها بنویسیم، بنابراین شما باید با نحوه نوشتن عبارات اساسی مانند فراخوانی تابع، if، حلقهها و مواردی از این قبیل آشنا باشید. من هر ساختاری از این قبیل را در کتاب معرفی میکنم که به آنها نیاز داشته باشیم تا ببینیم چگونه به زبان R نوشته شدهاند، اما وقت زیادی برای توضیح آنها صرف نمیکنم. بیشتر، من از شما انتظار دارم که بتوانید آن را از نمونهها انتخاب کنید.
به طور مشابه، من انتظار ندارم که شما قبلاً بدانید که چگونه دادهها را برازش کنید و مدلها را در R مقایسه کنید. من فرض میکنم که شما به اندازه کافی مقدمه آمار را داشته اید تا با عبارات اساسی مانند تخمین پارامتر، برازش مدل، متغیرهای توضیحی و پاسخ، و مقایسه مدل در غیر این صورت، من از شما انتظار دارم که حداقل بتوانید در مواقعی که نیاز دارید، آنچه را که در مورد آن صحبت میکنیم، انتخاب کنید.
من انتظار ندارم که شما اطلاعات زیادی در مورد آمار و برنامهنویسی داشته باشید، اما این “علم داده برای آدمکها” نیست، بنابراین من از شما انتظار دارم بدون اینکه من همه چیز را با جزئیات توضیح دهم، مثالهایی را بیابید.
پس از هفت فصل اول کتاب Beginning Data Science in R 4، شرح کوتاهی از پروژه تجزیه و تحلیل دادهها است که یکی از دانشآموزانم اولینباری که آن را برگزار کردم برای کلاس من انجام داد. این نشان میدهد که چنین پروژهای چگونه میتواند به نظر برسد، اما من به شما پیشنهاد میکنم که تا پایان هفت فصل اول صبر نکنید تا خودتان شروع به انجام چنین تحلیلی کنید.
برای اینکه از خواندن کتاب Beginning Data Science in R 4 بیشترین بهره را ببرید، باید به طور مداوم آنچه را که یاد میگیرید به کار ببرید. از قبل وقتی شروع به خواندن میکنید، پیشنهاد میکنم مجموعه داده ای را بیابید که علاقهمند به کسب اطلاعات بیشتر در مورد آن هستید و سپس آنچه را که در هر فصل میآموزید در آن دادهها اعمال کنید.
برای هشت فصل بعدی کتاب Beginning Data Science in R 4، تمرکز بر برنامهنویسی است. برای خواندن این بخش، باید با برنامهنویسی شی گرا آشنا باشید—من توضیح خواهم داد که چگونه آن را در R مدیریت میکنیم و تفاوت آن با زبانهایی مانند پایتون، جاوا یا C++ چیست.
با این حال، من انتظار دارم که شما با اصطلاحاتی مانند سلسله مراتب کلاس، وراثت و روشهای چند شکلی آشنا باشید. من از شما انتظار ندارم که از قبل با برنامهنویسی تابعی آشنا باشید (اما اگر آشنا هستید، اگر از قبل با برنامهنویسی R آشنا نیستید، هنوز چیزهای زیادی برای یادگیری در آن فصل وجود خواهد داشت). فصل آخر یک شرح دیگر پروژه است.
برای کتاب برنامهریزی کنید
در کتاب Beginning Data Science in R 4، دستکاری دادهها را پوشش خواهیم داد:
فیلتر کردن و انتخاب دادههای مربوطه
تبدیل دادهها به اشکالی که به راحتی قابل تجزیه و تحلیل هستند
جمع بندی دادهها
تجسم دادهها به روشهای آموزنده هم برای کاوش دادهها و هم برای ارائه نتایج
ساختمان نمونه
اینها جنبههای حیاتی انجام تحلیل در علم داده است. پس از این، نحوه توسعه کد R که قابل استفاده مجدد است و به خوبی با بستههای موجود کار میکند و به راحتی قابل گسترش است را توضیح میدهیم و خواهیم دید که چگونه بستههای R جدید بسازیم که افراد دیگر بتوانند در پروژههای خود استفاده کنند. اینها مهارتهای ضروری هستند که شما برای توسعه روشهای خود و به اشتراک گذاری آنها با جهان نیاز دارید.
R یکی از محبوب ترین (و منبع باز) زبانهای برنامهنویسی تجزیه و تحلیل دادهها در حال حاضر است. البته محبوبیت به معنای کیفیت نیست. با این حال، از آنجایی که R بسیار محبوب است، دارای یک اکوسیستم غنی از برنامههای افزودنی است (به نام «بستهها» در R) تقریباً برای هر نوع تحلیلی که میتوانید به آن علاقهمند باشید.
افرادی که روشهای آماری را توسعه میدهند اغلب آنها را به عنوان بستههای R پیادهسازی میکنند، بنابراین شما معمولاً میتوانید تکنیکهای پیشرفته را در R به راحتی دریافت کنید. محبوبیت همچنین به این معنی است که جامعه بزرگی از مردم وجود دارد که در صورت بروز مشکل میتوانند به شما کمک کنند. اکثر مشکلاتی که با آن مواجه میشوید را میتوان با چند دقیقه در Google یا Stack Overflow حل کرد زیرا بعید است اولین کسی باشید که با مشکل خاصی مواجه میشوید. همچنین آموزشهای آنلاین زیادی برای کسب اطلاعات بیشتر در مورد R و بستههای تخصصی وجود دارد. و اگر میخواهید بیشتر بدانید، کتابهای زیادی وجود دارد که میتوانید بخرید.
تجزیه و تحلیل دادهها و تجسم
موضوعات تمرکز بر تجزیه و تحلیل دادهها و تجسم در هشت فصل اول:
1. مقدمه ای بر برنامهنویسی R: در این فصل از کتاب Beginning Data Science in R 4 نحوه کار با دادهها و نوشتن خطوط لوله داده را یاد میگیریم.
2. تجزیه و تحلیل تکرارپذیر: در این فصل از کتاب Beginning Data Science in R 4، نحوه ادغام اسناد و تجزیه و تحلیل در یک سند واحد و نحوه استفاده از چنین اسنادی برای تولید تحقیقات تکرارپذیر را درمییابیم.
3. دستکاری دادهها: در این فصل از کتاب Beginning Data Science in R 4، نحوه وارد کردن دادهها، مرتب کردن دادهها، تبدیل و محاسبه خلاصهها از دادهها را میآموزیم.
4. تجسم دادهها: در این فصل از کتاب Beginning Data Science in R 4، ما یاد میگیریم که چگونه نمودارهایی برای کاوش ویژگیهای داده و ارائه ویژگیهای داده و نتایج تجزیه و تحلیل ایجاد کنیم.
5. کار با مجموعه دادههای بزرگ: در این فصل از کتاب Beginning Data Science in R 4، نحوه برخورد با دادهها را میبینیم که در آن تعداد مشاهدات، رویکردهای معمول ما را بسیار کند میکند.
6. یادگیری نظارت شده: در این فصل از کتاب Beginning Data Science in R 4، نحوه آموزش مدلها را زمانی که مجموعه دادههایی با کلاسهای شناخته شده یا مقادیر رگرسیون داریم، یاد میگیریم.
7. یادگیری بدون نظارت: در این فصل از کتاب Beginning Data Science in R 4 میآموزیم که چگونه الگوهایی را که در دادهها از آنها آگاه نیستیم جستجو کنیم.
8. پروژه 1: ضربه زدن به بطری: پس از این فصلها، اولین پروژه، تجزیه و تحلیل ویژگیهای فیزیکوشیمیایی شراب است، که در آن تکنیکهای مختلف در حال استفاده را میبینیم.
توسعه نرمافزار
نه فصل بعدی کتاب Beginning Data Science in R 4 توسعه نرمافزار و بسته را پوشش میدهد:
1. عمیق تر در برنامهنویسی R: در این فصل از کتاب Beginning Data Science in R 4، ویژگیهای پیشرفتهتر زبان برنامهنویسی R را بررسی میکنیم.
2. کار با بردارها و لیستها: در این فصل از کتاب Beginning Data Science in R 4، دو ساختار داده ضروری، یعنی بردارها و لیستها را بررسی میکنیم.
3. برنامهنویسی تابعی: در این فصل از کتاب Beginning Data Science in R 4، یک ویژگی پیشرفته زبان برنامهنویسی R، یعنی برنامهنویسی تابعی را بررسی میکنیم.
4. برنامهنویسی شی گرا: در این فصل از کتاب Beginning Data Science in R 4 میآموزیم که چگونه R شیگرا را مدیریت میکند و چگونه میتوانیم از آن برای نوشتن کدهای عمومیتر استفاده کنیم.
5. ساختن یک بسته R: در این فصل از کتاب Beginning Data Science in R 4، اجزای ضروری یک بسته R و نحوه برنامهنویسی خود را یاد میگیریم.
6. تست و بررسی بسته بندی: در این فصل از کتاب Beginning Data Science in R 4، تکنیکهایی را برای آزمایش کد R و بررسی سازگاری بستههای R خود یاد میگیریم.
7. کنترل نسخه: در این فصل از کتاب Beginning Data Science in R 4، نحوه مدیریت کد تحت کنترل نسخه و نحوه همکاری با استفاده از GitHub را میآموزیم.
8. نمایهسازی و بهینهسازی: در این فصل از کتاب Beginning Data Science in R 4، ما یاد میگیریم که چگونه نقاط مهم کد را که در آن راه حلهای ناکارآمد سرعت ما را کند میکنند و تکنیکهایی برای کاهش آن شناسایی کنیم.
9. پروژه 2: رگرسیون خطی بیزی: در فصل آخر کتاب Beginning Data Science in R 4 به پروژه دوم میرسیم که در آن بسته ای برای رگرسیون خطی بیزی میسازیم.
گرفتن R و RStudio
برای انجام تمرینات کتاب Beginning Data Science in R 4 باید R را روی کامپیوتر خود نصب کنید. من به شما پیشنهاد میکنم که یک محیط یکپارچه داشته باشید زیرا زمانی که نقشهها، اسناد، کدها و غیره خود را در یک برنامه دارید، پیگیری پروژه کمی آسانتر است.
من از RStudio (www.rstudio.com/products/RStudio) استفاده میکنم که به گرمی توصیه میکنم. شما میتوانید آن را به صورت رایگان دریافت کنید – فقط پیوند را دنبال کنید – و من فرض میکنم که آن را دارید زمانی که لازم باشد در فصلهای بعدی کتاب Beginning Data Science in R 4 به محیط نرمافزاری که استفاده میکنید مراجعه کنم. اگرچه RStudio خاصی وجود نخواهد داشت و اکثر ابزارهای کار با R عمدتاً ویژگیهای مشابهی دارند، بنابراین اگر میخواهید از چیز دیگری استفاده کنید، احتمالاً میتوانید یادداشتها را بدون هیچ مشکلی دنبال کنید.
پروژهها
شما نمیتوانید نحوه تجزیه و تحلیل دادهها را بدون تجزیه و تحلیل دادهها یاد بگیرید و همچنین نمیتوانید نحوه توسعه نرمافزار را بدون توسعه نرمافزار درک کنید. تایپ کردن نمونههایی از کتاب به هیچ وجه مانند نوشتن کد به تنهایی نیست. حتی انجام تمرینهایی از کتاب – که واقعاً باید انجام دهید – با کار کردن روی پروژههای خودتان یکسان نیست.
به هر حال، تمرینها جنبههای جزئی جدا شده از مشکلاتی را که به تازگی با آنها آشنا شدهاید پوشش میدهند. قبل از هر کاری که در دنیای واقعی باید با آن سر و کار داشته باشید، فصلی از مطالب ارائه نشده است. باید خودتان مشخص کنید که چه کاری و چگونه باید انجام شود. اگر فقط تمرینهای این کتاب را انجام دهید، مهم ترین درس در تجزیه و تحلیل دادهها را از دست خواهید داد:
چگونه دادهها را کاوش کنیم و نسبت به آن احساسی داشته باشیم
نحوه انجام کارآگاهی لازم برای به دست آوردن درک از دادهها
چگونه با تمام نویزها و موارد عجیب و غریب موجود در هر مجموعه داده مقابله کنیم
و برای توسعه یک بسته، باید به نحوه طراحی و اجرای عملکرد آن فکر کنید تا توابع مختلف و ساختارهای داده به خوبی با هم تطابق داشته باشند.
من از طریق یک پروژه تجزیه و تحلیل دادهها به شما نشان خواهم داد که در کتاب Beginning Data Science in R 4 چگونه میتواند باشد. برای یادگیری نحوه تجزیه و تحلیل دادهها به تنهایی، باید خودتان نیز این کار را انجام دهید – و باید آن را با مجموعه داده ای که من برای شما کاوش نکرده ام انجام دهید. ممکن است مجموعه داده ای داشته باشید که قبلاً روی آن کار کرده اید، مجموعه داده ای از چیزی که فقط به آن علاقه دارید، یا احتمالاً میتوانید چیز جالبی در یک مخزن دادههای عمومی پیدا کنید، برای مثال، یکی از این موارد:
RDataMining.com: www.rdatamining.com/resources/data
مخزن یادگیری ماشین UCI: http://archive.ics.uci.edu/ml/
KDNuggets: www.kdnuggets.com/datasets/index.html
مجموعه دادههای Reddit R: www.reddit.com/r/datasets
مجموعه دادههای عمومی عالی GitHub: https://github.com/caesar0301/awesome-public-datasets
پیشنهاد میکنم برای خود مجموعه دادهای پیدا کنید و بعد از هر درس از مهارتهایی که آموختهاید برای کشف این مجموعه داده استفاده کنید. دادههایی را که به صورت جدول ساخته شدهاند با مشاهدات به عنوان ردیف و متغیرها به عنوان ستون انتخاب کنید زیرا این شکل دادههایی است که در کتاب Beginning Data Science in R 4 در نظر خواهیم گرفت.
در پایان هشت فصل اول، این دادهها را تجزیه و تحلیل خواهید کرد. شما میتوانید گزارشی در مورد تحلیل خود بنویسید که دیگران بتوانند آن را ارزیابی کنند تا آن را دنبال کنند و شاید آن را اصلاح کنند: شما در حال انجام علم تکرارپذیر هستید.
برای موضوعات برنامهنویسی، پروژه دیگری را توضیح خواهم داد که مسائل طراحی و پیادهسازی مربوط به ساخت یک بسته R را نشان میدهد. در آنجا، شما باید بتوانید از اجرای نسخه شخصی خود از پروژهای که من استفاده میکنم یاد بگیرید، اما مطمئناً با کار بر روی یک پروژه بدون هیچ کمکی، بیشتر با چالش مواجه خواهید شد. هر کاری که انجام میدهید، برای بهرهمندی کامل از این کتاب، باید در حین خواندن فصلهای برنامهنویسی، بسته خود را بسازید.
سرفصلهای کتاب Beginning Data Science in R 4:
- About the Author
- About the Technical Reviewer
- Acknowledgments
- Introduction
- Chapter 1: Introduction to R Programming
- Chapter 2: Reproducible Analysis
- Chapter 3: Data Manipulation
- Chapter 4: Visualizing Data
- Chapter 5: Working with Large Data Sets
- Chapter 6: Supervised Learning
- Chapter 7: Unsupervised Learning
- Chapter 8: Project 1: Hitting the Bottle
- Chapter 9: Deeper into R Programming
- Chapter 10: Working with Vectors and Lists
- Chapter 11: Functional Programming
- Chapter 12: Object-Oriented Programming
- Chapter 13: Building an R Package
- Chapter 14: Testing and Package Checking
- Chapter 15: Version Control
- Chapter 16: Profiling and Optimizing
- Chapter 17: Project 2: Bayesian Linear Regression
- Conclusions
- Index
جهت دانلود کتاب Beginning Data Science in R 4 میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.