کتاب Statistics for Data Science and Analytics (آمار برای علم داده و تجزیه و تحلیل) یک راهنمای جامع برای تجزیه و تحلیل آماری با استفاده از Python است که موضوعات مهم مفید برای علم داده مانند پیشبینی، همبستگی و اکتشاف داده را ارائه میدهد. نویسندگان مقدمهای بر علم آمار و کلان دادهها و همچنین مروری بر ساختارها و عملیاتهای داده پایتون ارائه میکنند.
در ادامه مقدمهای از کتاب Statistics for Data Science and Analytics را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Statistics for Data Science and Analytics:
در زمان نگارش این کتاب، حوزههای آمار و علم داده به سرعت در حال تکامل هستند تا نیازهای متغیر سازمانهای تجاری، دولتی و تحقیقاتی را برآورده کنند. تقسیمبندی به دو جامعهی متمایز برای شروع کار، اگرچه سادهسازی بیش از حد است اما همچنان مفید است:
- جوامع تحقیقاتی دانشگاهی و پزشکی سنتی که معمولاً پروژههای تحقیقاتی طولانیمدت را با رعایت استانداردهای دقیق نظارتی یا انتشار انجام میدهند.
- کسبوکارها و سازمانهای بزرگ که از روشهای آماری برای استخراج ارزش از دادههای خود، اغلب به صورت لحظهای، استفاده میکنند. برای این جامعهی علم داده، قابلیت اطمینان و ارزش از قوت آکادمیک مهمتر است.
اکنون که روشهای آماری جزء اصلی از چیزی است که هوش مصنوعی (AI) نامیده میشود، بیشتر کاربران این روشها در دستهی دوم قرار میگیرند. با این حال، بیشتر تکنیکهای خاص و همچنین زبان آمار، ریشه در گروه اول دارند.
در نتیجه، “بار اضافی” خاصی وجود دارد که واقعاً برای جامعهی علم داده مرتبط نیست. این بار اضافی گاهی اوقات میتواند مبهم یا گیجکننده باشد و در این کتاب، ما در مورد اینکه چه چیزی برای علم داده مهم است یا نه، راهنمایی ارائه میکنیم. ویژگی دیگر این کتاب استفاده از روشهای نمونهگیری مجدد/شبیهسازی برای توسعهی زیربنای استنتاج آماری (دشوارترین موضوع در یک دورهی مقدماتی) به روشی شفاف و قابل درک است.
ما با چند نمونه از آمار در عمل (از جمله دو مورد از اشتباهات آماری) شروع میکنیم، سپس مستقیماً به بررسی طراحی صحیح مطالعات و در نظر گرفتن نقش احتمالی شانس میپردازیم.
همهی موضوعات استاندارد آمار مقدماتی (احتمال، آمار توصیفی، استنتاج، نمونهگیری، همبستگی و غیره) در اینجا آمده است، اما گاهی اوقات آنها نه به عنوان موضوعات مستقل جداگانه، بلکه در متن وضعیتی که در آن مورد نیاز هستند، معرفی میشوند.
همراهی منابع وب
کد پایتون، مجموعه دادهها، برخی راهحلها و سایر مطالب همراه با کتاب Statistics for Data Science and Analytics را میتوان در https://introductorystatistics.com/ یافت.
پایتون
پایتون یک زبان برنامهنویسی عمومی است که در بسیاری از زمینههای مختلف قابل استفاده است. این زبان به ویژه در بین جامعهی یادگیری ماشین و علم داده محبوب است. طیف گستردهای از کتابخانهها، راهحلهای کارآمدی را برای تقریباً هر نیازی ارائه میدهند، از اسکریپتهای سادهی یکبار مصرف تا سرورهای وب و برنامههای علمی بسیار پیچیده. همانطور که در طول این کتاب خواهیم دید، این زبان همچنین پشتیبانی عالی از آمار را دارد.
شما میتوانید به روشهای مختلفی از پایتون استفاده کنید. برای اکثر افراد تازه کار، سادهترین راه برای شروع کار استفاده از پایتون در نوتبوکهای جوبیتِر (نگاه کنید به https://jupyter.org/jupyter.org) است.
نوتبوکهای Jupyter اسنادی هستند که هم کد و هم عناصر متن غنی، مانند شکلها، لینکها، معادلات و غیره را در خود جای میدهند. به همین دلیل، آنها محیطی ایدهآل برای یادگیری پایتون و ارائهی کار شما هستند. شما کد نمونهی کتاب Statistics for Data Science and Analytics را در نوتبوکها در وبسایت ما (https://introductorystatistics.com/) خواهید یافت.
یک راه عالی برای شروع کار با پایتون، اجرای کد در یکی از پلتفرمهای رایانش ابری با دسترسی رایگان است. Google Colab (https://colab.research.google.com/) یک سطح رایگان دارد که برای همهی مثالهای کتاب Statistics for Data Science and Analytics کافی است.
گزینهای جایگزین برای پلتفرمهای رایانش ابری، نصب پایتون به صورت محلی روی رایانهی شماست. میتوانید نسخههای مختلف پایتون را از https://www.python.org دانلود و نصب کنید. با این حال، استفاده از Anaconda (https://www.anaconda.com) راحتتر است. Anaconda یک مدیر بستهی رایگان برای زبانهای برنامهنویسی پایتون و R است که بر محاسبات علمی تمرکز دارد. این نرمافزار محبوبترین بستههای پایتون را برای علم، ریاضی، مهندسی و تحلیل داده توزیع میکند. ما دستورالعملهای نصب دقیق را در وبسایت خود در https://introductorystatistics.com/ ارائه میده
سرفصلهای کتاب Statistics for Data Science and Analytics:
- Cover
- Table of Contents
- Title Page
- Copyright
- Dedication
- About the Authors
- Acknowledgments
- About the Companion Website
- Introduction
- 1 Statistics and Data Science
- 2 Designing and Carrying Out a Statistical Study
- 3 Exploring and Displaying the Data
- 4 Accounting for Chance-Statistical Inference
- 5 Probability
- 6 Categorical Variables
- 7 Surveys and Sampling
- 8 More than Two Samples or Categories
- 9 Correlation
- 10 Regression
- 11 Multiple Linear Regression
- 12 Predicting Binary Outcomes
- Index
- End User License Agreement
جهت دانلود کتاب Statistics for Data Science and Analytics میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.