کتاب Statistics Slam Dunk: Statistical analysis with R on real NBA data (آمار اسلم دانک: تجزیه و تحلیل آماری با R بر روی داده های واقعی NBA) مفاهیم مربوط به آمار و تجزیه و تحلیل دادهها را در مسابقات بسکتبال NBA با استفاده از زبان R تحلیل میکند.
در ادامه مقدمهای از کتاب Statistics Slam Dunk را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Statistics Slam Dunk:
آمار اسلم دانک تلاقی حداقل سه عامل است. اول، من خیلی میخواستم مهارتهای برنامهنویسی R خودم را بهبود بخشم. من به عنوان رهبر یک سازمان، وقت خود را صرف هدایت و مدیریت پروژه کار کارکنان خود، حذف موانع و سایر چالشها، توسعه اهداف، ایجاد و ارائه سخنرانیهای سطح اجرایی، استخدام (و گاهی اوقات اخراج) کارکنان، تهیه و برقراری ارتباط با ارزیابی عملکرد میکنم. محاسبه و تخصیص تعدیل غرامت سالانه و پاداش شایستگی و مانند آن. به عبارت دیگر، هیچ پهنای باندی برای نوشتن کد من باقی نمانده و بنابراین مهارتهای برنامهنویسی من را بهبود میبخشم.
دوم اینکه میخواستم کمی از کنجکاوی فکری خود را ارضا کنم. به عنوان مثال، در مورد توقف بهینه در الگوریتمهایی برای زندگی توسط: علوم کامپیوتری تصمیمات انسانی، نوشته برایان کریستین و تام گریفیث خوانده بودم. هوش انبوه در مقابل متخصصان و دیگر متخصصان در حکمت جمعیت، نوشته جیمز سوروویکی. قوانین قدرت و اثر لیندی از نسیم نیکلاس طالب، به ویژه در فریب خوردگان تصادفی، قو سیاه، ضدشکننده، و پوست در بازی. و مطالعات موردی که مزایای استراحت، مانند چرتهای بعدازظهر و جمعههای تعطیل را برای افزایش عملکرد و بهرهوری نشان میدهد.
در تمام طول مدت، من تعجب میکردم که چگونه این مفاهیم به بسکتبال حرفهای ترجمه شده است (من سالها بسکتبال را بصورت رقابتی و غیررقابتی بازی میکردم و در عین حال کنجکاوی فکری در مورد شروع بازی از دوران جوانی داشتم).
علاوه بر این، من در مورد قهرمانیهای دفاعی، بازیهایی که در کوارتر چهارم برنده شدهاند، و سقف حقوق NBA که برابری درون فصلی و بین فصلی ایجاد میکند، شک داشتم و میخواستم کشف کنم که دادهها چه میگویند. در نهایت، من میخواستم تعیین کنم که آیا تحلیلهای آماری ممکن است تانک زدن را توجیه کند یا ممکن است تعصبات داور یا رسمی را آشکار کند.
سوم، علیرغم تمایل (یا نیاز؟ ) من برای ارتقای مهارت خود در R، با این وجود معتقد بودم که تخصص و تجربهای دارم که ارزش انتقال به دیگران را دارد.
بیشتر بخوانید: کتاب Bayesian Methods in Statistics
هدف اصلی من این بود که هر فصل را به دو نیمه تقریباً مساوی سازماندهی کنم: نیمه اول یافتههای من را با عبارات غیرمعمول خلاصه میکند و نیمه دوم کمابیش یک مرور کد است. محتوایی برای همه وجود خواهد داشت!
در نهایت، زمانی که به نوشتن پیشنهاد کتابم رسیدم، متوجه شدم که اساساً در حال نوشتن دو کتاب هستم… و یک کتاب قطعاً به اندازه کافی چالش برانگیز خواهد بود. در حالی که من خوانندگان فنی و غیر فنی را به طور یکسان هدف قرار میدادم، شاید کتابم تمرکز کافی برای جذب کسی را نداشت. اساساً میدانستم که دارم یک کتاب برنامهنویسی و آمار مینویسم. من متعاقباً نسخه خطی را تغییر ساختار دادم و سپس پیشنهاد خود را به روز کردم.
با این وجود، Statistics Slam Dunk برخلاف سایر کتابهای «مانند» باقی میماند. از این گذشته، هدف اصلی من از همان ابتدا نوشتن کتابی متفاوت بود که به راحتی نمیتوان آن را با کتابهای راهنمای قبلی مقایسه کرد. هر فصل از ابتدا تا انتها مانند یک پروژه علم داده یا آمار در دنیای واقعی اجرا میشود. در آن زمان، من کار خود را در SAS شروع کردم، اما بعد دیدم که آینده در فناوریهای منبع باز است. دقیقاً به یاد ندارم چرا یا چگونه، اما R را انتخاب کردم… و هرگز به عقب نگاه نکردم – شما هم نباید.
Statistics Slam Dunk نسبتاً با سایر دستورالعملهای برنامهنویسی متفاوت است. سایر کتابهای مشابه معمولاً بر اساس تکنیک یا روش سازماندهی میشوند. به عنوان مثال، ممکن است فصلی در مورد عملیات متداول جدال دادهها، فصل دیگری در مورد رگرسیون خطی، فصل دیگری در مورد ایجاد نمودارهای اساسی و غیره وجود داشته باشد.
هیچ اشکالی ندارد. با این حال، در دنیای واقعی چیزی به عنوان پروژه جدال داده، پروژه رگرسیون خطی یا پروژه تجسم داده وجود ندارد. Slam Dunk آماری در عوض مبتنی بر پروژه است: هر عملیاتی که برای رسیدن از نقطه صفر به نقطه پایانی از پیش تعریف شده لازم است در هر فصل اجرا میشود، از بارگذاری بستهها، وارد کردن دادهها، به بحث کردن دادهها، کاوش در آن، تجسم آن، آزمایش آنها و مدلسازی آن. Statistics Slam Dunk به شما میآموزد که چگونه در مورد یک پروژه علم داده یا آمار از ابتدا تا انتها فکر کنید، راهاندازی و اجرا کنید.
این شماره یک است. شماره دو، Statistics Slam Dunk با مجموعه دادههای NBA سر و کار دارد و سعی میکند در هر فصل چیزی مفید و مرتبط را کشف کند که باید به دنیای شما منتقل شود. امیدوارم که Statistics Slam Dunk یک روش سرگرمکنندهتر و مؤثرتر برای یادگیری R باشد.
بشتر بخوانید: کتاب Statistics and Data Visualisation with Python
چه کسی باید کتاب Statistics Slam Dunk را بخواند؟
ناگفته نماند که آشنایی قبلی با R، یا حداقل تجربه قبلی با زبان برنامهنویسی آماری دیگری، به شما کمک میکند تا بهترین بهره را از این کتاب ببرید. علاوه بر این، مقداری دانش پایه از مفاهیم اولیه آماری، پیشینهای در تجسم دادهها و بهترین شیوههای آن و حتی درک اولیه از بازی بسکتبال و آشنایی با آمار پایه بسکتبال مفید خواهد بود.
با این حال، آمار اسلم دانک بسیار کم فرض میکند. R و RStudio، محیط توسعه یکپارچه (IDE) برای R، هر دو دانلود رایگان هستند. Statistics Slam Dunk فرض میکند که میتوانید نرمافزار را دانلود کرده و سپس با چند بار کلیک بر روی Next آن را نصب کنید.
در غیر این صورت، هر عملیات در سطحی از جزئیات توضیح داده شده است که برای دانشجویان کارشناسی و کارشناسی ارشد با پیشینه کم یا بدون پیشینه در R یا آمار، دانشمندان داده در سطح متوسطه یا متوسط و تحلیلگران داده با تجربه قبلی R مناسب است. خود را ارتقاء دهند و دیگر دانشمندان داده و تحلیلگران داده از زبان برنامهنویسی دیگری در حال انتقال هستند.
همانطور که گفته شد، محتوای کافی در Statistics Slam Dunk برای کسانی که قبلاً در R تجربه خوبی داشتهاند وجود دارد. اگر با R آشنا هستید، Statistics Slam Dunk به شما کمک میکند بیشتر در مفاهیم کلیدی آماری مستقر شوید، نشان میدهد که چگونه محتوای گرافیکی جذابی در خارج ایجاد کنید.
جریان اصلی، و بستهها و کارکردهای آنها را معرفی کنید که احتمال زیادی وجود دارد که هنوز در معرض آنها قرار نگرفته باشید. طرفداران بسکتبال و کسانی از شما که در بسکتبال کار میکنید قطعاً به یافتههای کتاب علاقهمند هستند – اما برای رسیدن به آن باید صدها خط کد و متن مکمل را بررسی کنید.
برای استفاده بیشتر از کتاب Statistics Slam Dunk، لازم نیست اصلاً با بازی بسکتبال آشنا باشید، بیش از آن که برای استفاده از مجموعه دادههای عنبیه (که با R همراه است و بیشتر از هر مورد دیگری استفاده میشود، باید باغبان باشید). مجموعه دادههای دیگر، برای نشان دادن تعداد زیادی از تکنیکها). هر چیزی که باید در مورد بسکتبال و مجموعه دادهها بدانید با جزئیات کامل توضیح داده شده است.
نحوه سازماندهی کتاب Statistics Slam Dunk: نقشه راه
آمار اسلم دانک در ۲۰ فصل سازماندهی شده است. تقریباً هر فصل یک پروژه یا داستان مستقل است که یک شروع، یک پایان و یک طرح در بین آنها دارد. به عنوان مثال، فصل ۵ را در نظر بگیرید، جایی که ما تأثیر فشار بر بردها و باختها را بررسی و آزمایش میکنیم. هر عملیاتی به تفصیل توضیح داده شده و نشان داده شده است، از بارگیری بستهها، وارد کردن دادهها، و کاوش و مشاجره مشابه، تا توسعه مدلها.
همانطور که گفته شد، در اینجا به تفکیک فصل به فصل آمده است:
فصل ۱ اساساً یک مقدمه است. در پایان، نه تنها باید راحت باشید، بلکه باید در مورد سرمایهگذاری یادگیری در R هیجانزده باشید. هیچ کدی در این فصل گنجانده نشده است.
فصل ۲ کتاب Statistics Slam Dunk نشان میدهد که چگونه میتوانید به بهترین نحو در مورد بازجویی از مجموعه دادهها، محاسبه آمار اولیه و تجسم نتایج خود اقدام کنید. همچنین میآموزید که چگونه بستهها را بارگیری کنید، دادهها را وارد کنید، دادهها را به هم بزنید و خلاصه کنید و محتوای گرافیکی جذابی را با استفاده از ترکیبی از توابع داخلی و بستهبندی شده ایجاد کنید.
فصل ۳ کتاب Statistics Slam Dunk ساختی از پایه است که در فصل قبل ایجاد شده است. شما یاد خواهید گرفت که چگونه ابزارها و میانهها را تجسم کنید، یک نمودار جریان به نام نمودار سانکی ایجاد کنید، تجزیه و تحلیل ارزش مورد انتظار را تنظیم و تخمین بزنید و یک مشکل یادگیری بدون نظارت به نام خوشهبندی سلسله مراتبی را انجام دهید.
فصل ۴ کتاب Statistics Slam Dunk نحوه تنظیم و تکمیل یک مسأله بهینهسازی محدود را نشان میدهد. همچنین یاد خواهید گرفت که چگونه توزیع دادهها را به بهترین شکل تجسم کنید و نظرات را به کد R خود اضافه کنید.
فصل ۵ کتاب Statistics Slam Dunk نحوه شناسایی نقاط پرت در دادههای خود، اجرای و تفسیر آزمونهای آماری نرمال بودن، محاسبه و تجسم همبستگی بین متغیرهای پیوسته، ایجاد یک رگرسیون خطی چندگانه و تفسیر نتایج، و توسعه درخت تصمیم و ترسیم آن را نشان میدهد.
فصل ۶ کتاب Statistics Slam Dunk نحوه زیرمجموعه کردن مجموعه دادهها، جداسازی و پیوستن به مجموعه دادهها، تغییر نام و تبدیل متغیرها، در میان سایر عملیات جدال دادهها را نشان میدهد. علاوه بر این، یاد خواهید گرفت که چگونه بسیاری از بهترین روشها را در تجسم دادهها اعمال کنید، از جمله لمسهای کوچکی که میتواند تفاوت بزرگی با مخاطبان شما ایجاد کند.
فصل ۷ کتاب Statistics Slam Dunk نحوه اجرا، تفسیر و تجسم آزمونهای t و همچنین اجرای و تفسیر آزمونهای اندازه اثر مکمل را نشان میدهد.
فصل ۸ کتاب Statistics Slam Dunk قانون توقف بهینه را معرفی میکند که اغلب به عنوان قانون ۳۷ درصد از آن یاد میشود. علاوه بر این، یاد خواهید گرفت که چگونه یک متغیر مشتق شده از یک رشته فرعی ایجاد کنید. ایجاد یک جدول فرکانس؛ یک تم به تجسمهای ایجاد شده در ggplot۲، بسته گرافیکی برتر مورد استفاده در سراسر کتاب اضافه کنید. وارد کردن و درج تصاویر در سایر محتوای ggplot۲. و چندین خط روند را به یک سری داده در نمودارهای خطی ggplot۲ اضافه کنید.
فصل ۹ کتاب Statistics Slam Dunk شامل یک بحث کامل در مورد جایگشتها و ترکیبات است – چگونه میتوان یکی از دیگری را متمایز کرد و چگونه آن را محاسبه کرد. همچنین یاد خواهید گرفت که چگونه محتوای بصری عالی، البته تا حدودی غیر معمول، از جمله طرحهای وجهی، طرحهای بالن و طرحهای موزاییکی ایجاد کنید. اجرای و تفسیر آزمونهای آماری با اهمیت بر روی دادههای طبقهبندی. و تستهای اندازه اثر مکمل را روی همان دادهها اجرا و تفسیر کنید.
فصل ۱۰ کتاب Statistics Slam Dunk نحوه محاسبه ضرایب همبستگی بین جفت متغیرهای پیوسته را نشان میدهد. انجام تستهای همبستگی؛ نمودارهای همبستگی، نمودارهای نقطهای و نمودارهای آب نبات چوبی ایجاد کنید. برچسبها را از طریق تبدیل و الحاق تغییر دهید. و با مقادیر از دست رفته در دادههای خود مقابله کنید.
فصل ۱۱ کتاب Statistics Slam Dunk نحوه اجرای نوع دیگری از مسأله یادگیری بدون نظارت را نشان میدهد، خوشهبندی K-means. شما یاد خواهید گرفت که چگونه تعداد بهینه خوشههای رقابتی را محاسبه و تجسم کنید، خوشهها را ایجاد کنید و همان را ترسیم کنید. همچنین یاد خواهید گرفت که چگونه یک طرح نقطهای کلیولند ایجاد کنید، نوع دیگری از تجسم که ممکن است غیر معمول باشد، اما با این وجود داستانی سریع و قانعکننده را بیان میکند.
فصل ۱۲ کتاب Statistics Slam Dunk ضرایب جینی و نحوه تجسم نابرابری با منحنیهای لورنز را معرفی میکند. شما در معرض آزمایشهای اهمیت و اندازه اثر قرار خواهید گرفت.
فصل ۱۳ کتاب Statistics Slam Dunk دوباره نحوه محاسبه و تفسیر ضرایب جینی را نشان میدهد، اما در بالای مجموعه دادهای متفاوت از آنچه در فصل قبل استفاده شد. همچنین یاد خواهید گرفت که چگونه منحنیهای جایگزین لورنز را ایجاد کنید، آزمونهای t (دوباره) و آزمونهای F را انجام دهید و سایر آزمونهای اندازه اثر را که در فصلهای قبلی نشان داده نشدهاند انجام دهید. همچنین شامل بخشهایی در مورد ایجاد حلقهها و نوشتن توابع خود میباشد.
فصل ۱۴ ممکن است سنگینترین و فنیترین فصل کتاب Statistics Slam Dunk باشد. شما یاد خواهید گرفت که چگونه تستهای همبستگی را اجرا کنید و نتایج آنها را تفسیر کنید. توسعه مدل تحلیل واریانس (ANOVA). ایجاد یک رگرسیون لجستیک؛ درک و تمایز احتمالات، نسبت شانس، و شانس ورود به سیستم. یک منحنی مشخصه عملکرد گیرنده (ROC) ایجاد کنید. و جعبههای نسبتاً غیرعادی ایجاد کنید.
فصل ۱۵ کتاب Statistics Slam Dunk بیشتر به بحث در مورد قانون ۸۰-۲۰ و روشهای جایگزین ایجاد نمودارهای پارتو اختصاص دارد. همچنین یاد خواهید گرفت که چگونه طرحهای ویولن و هیستوگرامهای جفتی ایجاد کنید.
فصل ۱۶ کتاب Statistics Slam Dunk اساساً بحث تصادفی بودن زمانی است که دیگران ممکن است علیت را ببینند. شما در مورد قانون جانشینی لاپلاس، نحوه شبیهسازی چرخش سکه، و نحوه قرار دادناشیاء ggplot۲ در سایراشیاء ggplot۲ (یک ویژگی بسیار جالب) آشنا خواهید شد.
فصل ۱۷ با نمایشهای متوالی از سه بسته تجزیه و تحلیل دادههای اکتشافی خودکار رقابتی باز میشود. تکنیکهای کاربردی و زیباییشناختی پیشرفته که میتوانند در نمودارهای نواری ggplot۲ اعمال شوند نیز معرفی شدهاند.
فصل ۱۸ کتاب Statistics Slam Dunk چندین معیار پراکندگی آماری را معرفی میکند و در مورد چرایی یا چگونگی استفاده از آنها به بهترین شکل بحث میکند. شما همچنین یاد خواهید گرفت که چگونه Churn را محاسبه کنید و چگونه یک نمودار هرمی ایجاد کنید.
فصل ۱۹ کتاب Statistics Slam Dunk چندین روش استانداردسازی یا عادیسازی دادهها را معرفی میکند و چرایی و چگونگی اعمال آنها را مورد بحث قرار میدهد. همچنین میآموزید که چگونه فریمهای داده را رنگآمیزی کنید و مشاهدات را برجسته کنید و چگونه محتویات دو مجموعه داده را با هم مقایسه کنید.
فصل ۲۰ کتاب Statistics Slam Dunk خلاصهای است که تکنیکهای اعمال شده بین فصلهای ۲ و ۱۹ کتاب Statistics Slam Dunk را مرور میکند و نتایجی را که همین تکنیکها در طول مسیر ایجاد کردهاند، خلاصه میکند. این یک بازخوانی فصل به فصل نیست، بلکه تلفیقی از یافتههای کلیدی از نه حوزه آموزشی است که اغلب در این کتاب پوشش داده شده است، از جمله تجزیه و تحلیل خوشهای، آزمون معناداری، آزمایش اندازه اثر، مدلسازی، تحقیق در عملیات، احتمال، پراکندگی آماری، استانداردسازی و آمار خلاصه و تجسم.
بدیهی است که این توصیف بسیار سطح بالایی از این فصلها بود. Statistics Slam Dunk تعداد زیادی عملیات جدال داده را نشان میدهد که در لیست قبلی ذکر نشده است – به عنوان مثال، نحوه رها کردن ستونها یا ردیفها. چگونه دادههای خود را از طولانی به گسترده یا برعکس منتقل کنید.
نحوه خلاصه کردن دادهها و در صورت لزوم توسط گروهها. نحوه ایجاد بخشهایی از منطق شرطی. و چگونه میتوان فرمتهای تاریخ را دستکاری کرد. Statistics Slam Dunk همچنین شامل تقریباً ۳۰۰ تصویرسازی و تقریباً ۴۰ نوع نمودار است که بیشتر آنها در ggplot۲ یا با پسوندهای ggplot۲ توسعه یافتهاند.
اغلب، بهترین و مؤثرترین راه برای درک مخاطبان خود از نتایج سایر تکنیکها یا روشها، ایجاد محتوای گرافیکی است. ایجاد تجسمهای متقاعدکننده میتواند سخت باشد. استفاده از بهترین شیوهها و به کارگیری آخرین کارهای انجام شده (افزودن عنوان و زیرنویس، اضافه کردن شرح، حاشیهنویسی تصاویر، قالببندی مجدد برچسبها، دستکاری محورها و غیره) گاهی اوقات میتواند سختتر باشد. تقریباً هر فصل کتاب Statistics Slam Dunk زیر مجموعهای از این تکنیکها را آموزش میدهد.
سرفصلهای کتاب Statistics Slam Dunk:
- Statistics Slam Dunk
- brief contents
- contents
- foreword
- preface
- acknowledgments
- about this book
- about the author
- about the cover illustration
- Chapter 1: Getting started
- Chapter 2: Exploring data
- Chapter 3: Segmentation analysis
- Chapter 4: Constrained optimization
- Chapter 5: Regression models
- Chapter 6: More wrangling and visualizing data
- Chapter 7: T-testing and effect size testing
- Chapter 8: Optimal stopping
- Chapter 9: Chi-square testing and more effect size testing
- Chapter 10: Doing more with ggplot2
- Chapter 11: K-means clustering
- Chapter 12: Computing and plotting inequality
- Chapter 13: More with Gini coefficients and Lorenz curves
- Chapter 14: Intermediate and advanced modeling
- Chapter 15: The Lindy effect
- Chapter 16: Randomness versus causality
- Chapter 17: Collective intelligence
- Chapter 18: Statistical dispersion methods
- Chapter 19: Data standardization
- Chapter 20: Finishing up
- Appendix: More ggplot2 visualizations
- index
جهت دانلود کتاب Statistics Slam Dunk میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.