کتاب Data Wrangling Using Pandas, SQL, and Java

Name: کتاب Data Wrangling Using Pandas, SQL, and Java
Author: Oswald Campesato

اثر Oswald Campesato

category

نوع محتوای کتاب

راهنمای مرجع

category

هدف یادگیری

ارتقای شغلی

category

نوع مسیر

مرجع / کتابچه راهنما

category

بر اساس تکنولوژی

علوم داده

category

بر اساس سطح علمی

متوسط

info نکات مهم قبل از خرید:

نسخه کتاب فعلی به زبان لاتین می‌باشد.
کتاب به صورت محصول می‌باشد و پس از خرید بلافاصله در دسترس شما قرار می‌گیرد.
قبل از خرید، قسمت توضیحات تکمیلی مربوط به هر کتاب را مطالعه کنید.
در صورت هرگونه سؤال با ایمیل و یا شماره پشتیبانی سایت در تماس باشید.
درگاه پرداخت رمزارز نیز برای هموطنان خارج از کشور فعال است.

درباره این کتاب

کتاب Data Wrangling Using Pandas, SQL, and Java (آماده سازی داده با استفاده از Pandas, SQL و جاوا) راهنمای جامعی است که خوانندگان را با مهارت های ضروری برای دستکاری و مدیریت موثر داده ها با استفاده از ابزارهای قدرتمندی مانند Pandas, SQL و جاوا مجهز می‌کند. این کتاب از طریق مثال‌های عملی و توضیحات مفصل، رویکردی گام به گام برای تسلط بر هنر جدال داده‌ها، از تکنیک‌های اولیه تا…

۲۶,۰۰۰ تومان

کتاب‌های پیشنهادی این تخصص:

کتاب A+

۳۱,۰۰۰ تومان

کتاب Django 5 By Example

۳۰,۰۰۰ تومان

کتاب AI Engineering

۳۰,۰۰۰ تومان

کتاب +Network

۳۵,۰۰۰ تومان

کتاب C# 13 and .NET 9

۳۰,۰۰۰ تومان

کتاب‌های پیشنهادی این تخصص:

کتاب Mastering Azure Security

Packt

۲۳,۰۰۰ تومان

کتاب Getting Started with Ethereum

Apress

۲۱,۰۰۰ تومان

کتاب Scala for the Impatient

Addison-Wesley Professional

۲۴,۰۰۰ تومان

کتاب Time Series Algorithms Recipes

Apress

۲۳,۰۰۰ تومان

کتاب Make Your Data Speak

Apress

۲۳,۰۰۰ تومان

کتاب Introduction to Datafication

Apress

۲۸,۰۰۰ تومان

کتاب Arduino Programming for Beginners

۲۷,۰۰۰ تومان

کتاب The Art of SXO

۲۶,۰۰۰ تومان

کتاب Okta Administration Up and Running

۲۶,۰۰۰ تومان

کتاب Data Observability for Data Engineering

۲۶,۰۰۰ تومان

نظرات کاربران

تجربیات خود را از خواندن این کتاب با دیگران به اشتراک بگذارید.

—

امتیاز کل

star star star star star

از 0 نظر

ثبت نظر جدید

دیدگاهتان را بنویسید

هنوز دیدگاهی ثبت نشده است.

این کتاب از طریق مثال‌های عملی و توضیحات مفصل، رویکردی گام به گام برای تسلط بر هنر جدال داده‌ها، از تکنیک‌های اولیه تا استراتژی‌های پیشرفته، ارائه می‌کند. چه یک مبتدی یا یک متخصص داده با تجربه باشید، این کتاب به شما کمک می کند مهارت خود را در مدیریت داده ها و استخراج بینش های ارزشمند برای تصمیم گیری و تجزیه و تحلیل افزایش دهید.

در ادامه مقدمه‌ای از کتاب Data Wrangling Using Pandas, SQL, and Java را از زبان نویسنده شرح خواهیم داد.

مقدمه‌ای بر کتاب Data Wrangling Using Pandas, SQL, and Java:

ارزش پیشنهادی برای این کتاب چیست؟

این کتاب حاوی مقدمه‌ای سریع برای اطلاعات مرتبط در مورد مدیریت داده‌ها است که می‌تواند به طور منطقی در کتابی با این اندازه گنجانده شود. با این حال، شما در معرض انواع ویژگی‌های NumPy و Pandas، نحوه ایجاد پایگاه‌های داده و جداول در MySQL، و نحوه انجام بسیاری از کار‌های پاکسازی داده‌ها و جدال داده‌ها خواهید بود.

برخی از موضوعات به صورت گذرا ارائه شده است که به دو دلیل عمده است. اول، مهم است که شما در معرض این مفاهیم باشید. در برخی موارد، موضوعاتی را می‌یابید که ممکن است علاقه شما را برانگیزد و از این رو شما را ترغیب می‌کند تا از طریق مطالعه شخصی در مورد آن‌ها بیشتر بدانید. در موارد دیگر، احتمالاً با یک مقدمه کوتاه قانع خواهید شد. به عبارت دیگر، شما تصمیم می‌گیرید که در مورد موضوعات این کتاب به جزئیات بیشتری بپردازید یا خیر.

دوم، پرداختن کامل به تمام موضوعاتی که در این کتاب پوشش داده شده است، حجم آن را به میزان قابل توجهی افزایش می‌دهد و تعداد کمی از افراد زمان لازم برای خواندن مضامین فنی را دارند.

مخاطبان هدف کتاب Data Wrangling Using Pandas, SQL, and Java

این کتاب در درجه اول برای افرادی در نظر گرفته شده است که قصد دارند دانشمند داده شوند و همچنین هر کسی که نیاز به انجام وظایف پاکسازی داده دارد. این کتاب همچنین برای دستیابی به مخاطبان بین‌المللی از خوانندگان با پیشینه‌های بسیار متنوع در گروه‌های سنی مختلف در نظر گرفته شده است.

از این رو، این کتاب به جای عبارات محاوره‌ای که ممکن است برای آن خوانندگان گیج‌کننده باشد، از انگلیسی استاندارد استفاده می‌کند. افراد با انواع مختلف تقلید، که شامل خواندن، نوشتن، یا شنیدن مطالب جدید می‌شود، یاد می‌گیرند. این کتاب این نکات را در نظر می‌گیرد تا تجربه یادگیری راحت و معناداری را برای خوانندگان مورد نظر فراهم کند.

من از کتاب Data Wrangling Using Pandas, SQL, and Java چه خواهم آموخت؟

فصل اول به طور خلاصه پایتون را معرفی می‌کند و به دنبال آن فصل ۲، که به پردازش انواع داده‌های مختلف در یک مجموعه داده، همراه با عادی‌سازی، استانداردسازی و مدیریت داده‌های از دست رفته می‌پردازد. شما در مورد نقاط پرت و نحوه تشخیص آن‌ها از طریق z-scores و تبدیل چندک خواهید آموخت. سپس با SMOTE برای مدیریت مجموعه داده‌های نامتعادل آشنا خواهید شد.

فصل ۳ Pandas را معرفی می‌کند، که یک کتابخانه قدرتمند پایتون است که به شما امکان می‌دهد محتویات فایل‌های CSV (و سایر فایل‌های متنی) را در فریم‌های داده (تا حدودی مشابه صفحات گسترده اکسل) بخوانید، جایی که می‌توانید به‌طور برنامه‌نویسی داده‌ها را برش دهید و تاس بزنید. مطابق با نیاز‌های شما

از آنجایی که مقادیر زیادی از داده‌ها به شکل داده‌های ساختار یافته در پایگاه‌های داده رابطه‌ای ذخیره می‌شوند، فصل ۴ شما را با مفاهیم SQL و نحوه انجام عملیات اساسی در MySQL، مانند کار با پایگاه‌های داده، آشنا می‌کند.

فصل ۵ شامل نمونه کد‌های مبتنی بر جاوا برای ایجاد و دسترسی به داده‌ها در پایگاه داده MySQL است. فصل ۶ شما را با پاکسازی داده‌ها، همراه با تکنیک‌های مختلف برای رسیدگی به سناریو‌های مختلف، مانند داده‌های از دست رفته و اطلاعات پرت آشنا می‌کند.

فصل هفتم این کتاب بحث جدال داده‌ها را توضیح می‌دهد و شامل اسکریپت‌های پایتون و اسکریپت‌های پوسته مبتنی بر awk برای حل وظایف مختلف است. در نهایت، یک پیوست برای awk وجود دارد که به شما در درک اسکریپت‌های مبتنی بر awk در فصل ۷ کمک می‌کند.

چرا نمونه‌های کد عمدتاً در پایتون هستند؟

اکثر نمونه‌های کد کوتاه هستند (معمولاً کمتر از یک صفحه و گاهی کمتر از نیم صفحه)، و در صورت نیاز، می‌توانید به راحتی و به سرعت کد را در یک نوت بوک جدید Jupyter کپی/جایگذاری کنید. برای نمونه‌های کد پایتون که به یک فایل CSV اشاره می‌کنند، برای دسترسی به فایل CSV به یک قطعه کد اضافی در نوت‌بوک Jupyter مربوطه نیاز دارید. علاوه بر این، نمونه‌های کد به سرعت اجرا می‌شوند، بنابراین نیازی به استفاده از GPU رایگان ارائه‌شده در Google Colaboratory ندارید.

اگر تصمیم به استفاده از Google Colaboratory دارید، می‌توانید به راحتی کد پایتون را در یک نوت بوک کپی/پیست کنید و از ویژگی آپلود برای آپلود نوت بوک‌های Jupyter موجود استفاده کنید. نکته زیر را در نظر داشته باشید: اگر کد پایتون به یک فایل CSV ارجاع می‌دهد، مطمئن شوید که قطعه کد مناسب (همانطور که در فصل ۱ توضیح داده شد) را برای دسترسی به فایل CSV در نوت‌بوک Jupyter مربوطه در Google Colaboratory وارد کرده‌اید.

بیشتر بخوانید: کتاب Data-Driven Decision Making in Entrepreneurship

آیا باید بخش‌های تئوری کتاب Data Wrangling Using Pandas, SQL, and Java را بیاموزم؟

بار دیگر، پاسخ به میزان برنامه‌ریزی شما برای مشارکت در تجزیه و تحلیل داده‌ها بستگی دارد. به عنوان مثال، اگر قصد مطالعه یادگیری ماشین را دارید، احتمالاً یاد خواهید گرفت که چگونه یک مدل ایجاد و آموزش دهید، که کاری است که پس از انجام وظایف پاکسازی داده‌ها انجام می‌شود. به طور کلی، اگر قصد دارید مهندس یادگیری ماشین شوید، احتمالاً باید همه چیز‌هایی را که در این کتاب با آن مواجه می‌شوید، یاد بگیرید.

بیشترین بهره را از این کتاب ببرید:

برخی از برنامه‌نویسان از نثر به خوبی یاد می‌گیرند، برخی دیگر از نمونه کد (و بسیاری از آنها) به خوبی یاد می‌گیرند، به این معنی که هیچ سبک واحدی وجود ندارد که برای همه قابل استفاده باشد.

علاوه بر این، برخی از برنامه‌نویسان می‌خواهند ابتدا کد را اجرا کنند، ببینند چه کار می‌کند، و سپس به کد بازگردند تا جزئیات را بررسی کنند (و برخی دیگر از روش مخالف استفاده می‌کنند).

در نتیجه، انواع مختلفی از نمونه‌های کد در این کتاب وجود دارد: برخی کوتاه، برخی طولانی، و نمونه‌های کد دیگر از نمونه‌های کد قبلی ساخته می‌شوند.

برای این کتاب چه چیز‌هایی باید بدانم؟

دانش فعلی Python ۳. x مفیدترین مهارت است. دانش سایر زبان‌های برنامه‌نویسی (مانند جاوا) نیز به دلیل قرار گرفتن در معرض مفاهیم و ساختار‌های برنامه‌نویسی می‌تواند مفید باشد. هرچه دانش فنی کمتری داشته باشید، برای درک موضوعات مختلفی که تحت پوشش قرار می‌گیرند، کوشش بیشتری لازم است.

اگر می‌خواهید مطمئن شوید که می‌توانید مطالب این کتاب را درک کنید، به برخی از نمونه‌های کد نگاهی بیندازید تا متوجه شوید که چقدر برای شما آشناست و چقدر برای شما جدید است.

آیا این کتاب حاوی نمونه کد‌های سطح تولید است؟

هدف اصلی از نمونه‌های کد در این کتاب، نشان دادن کتابخانه‌های مبتنی بر پایتون برای حل انواع وظایف مرتبط با داده‌ها در ارتباط با دستیابی به درک ابتدایی مفاهیم آماری است. وضوح اولویت بالاتری نسبت به نوشتن کد فشرده‌تری دارد که درک آن دشوارتر است (و احتمالاً بیشتر مستعد اشکال است). اگر تصمیم دارید از کد‌های موجود در این کتاب در یک وب سایت تولیدی استفاده کنید، باید آن کد را با همان تجزیه و تحلیل دقیق سایر بخش‌های پایه کد خود قرار دهید.

پیش نیاز‌های غیر فنی برای این کتاب چیست؟

اگرچه تعیین پاسخ به این سؤال دشوارتر است، اما بسیار مهم است که میل شدید به یادگیری در مورد تمیز کردن و بحث کردن داده‌ها، همراه با انگیزه و نظم برای خواندن و درک نمونه کد‌ها داشته باشید.

چگونه یک پوسته فرمان را تنظیم کنم؟

اگر کاربر مک هستید، سه راه برای این کار وجود دارد. روش اول این است که از Finder برای پیمایش به Applications > Utilities استفاده کنید و سپس روی برنامه Utilities دوبار کلیک کنید. در مرحله بعد، اگر قبلاً یک پوسته فرمان در دسترس دارید، می‌توانید با تایپ دستور زیر یک پوسته فرمان جدید راه‌اندازی کنید:

/Applications/Utilities/Terminal. app را باز کنید

روش دوم برای کاربران مک، باز کردن یک پوسته فرمان جدید در مک بوک از یک پوسته فرمان است که از قبل به سادگی با کلیک کردن روی command+n در آن پوسته فرمان قابل مشاهده است، و مک شما پوسته فرمان دیگری را راه‌اندازی می‌کند.

اگر کاربر رایانه شخصی هستید، می‌توانید Cygwin (متن باز: https://cygwin.com/) را نصب کنید که دستورات bash را شبیه‌سازی می‌کند، یا از جعبه ابزار دیگری مانند MKS (یک محصول تجاری) استفاده کنید. لطفاً مستندات آنلاینی را که فرآیند دانلود و نصب را توضیح می‌دهد، بخوانید. توجه داشته باشید که اگر نام مستعار سفارشی در فایلی غیر از فایل راه‌اندازی اصلی (مانند. bash_login) تعریف شوند، به‌طور خودکار تنظیم نمی‌شوند.

سرفصل‌های کتاب Data Wrangling Using Pandas, SQL, and Java:

Cover
Title Page
Copyright
Dedication
Contents
Preface
Chapter 1: Introduction to Python
Chapter 2: Working with Data
Chapter 3: Introduction to Pandas
Chapter 4: RDBMS and SQL
Chapter 5: Java, JSON, and XML
Chapter 6: Data Cleaning Tasks
Chapter 7: Data Wrangling
Appendix A: Working with awk
Index

جهت دانلود کتاب Data Wrangling Using Pandas, SQL, and Java می‌توانید پس از پرداخت، دریافت کنید.