کتاب Data Wrangling Using Pandas, SQL, and Java (آماده سازی داده با استفاده از Pandas, SQL و جاوا) راهنمای جامعی است که خوانندگان را با مهارت های ضروری برای دستکاری و مدیریت موثر داده ها با استفاده از ابزارهای قدرتمندی مانند Pandas, SQL و جاوا مجهز میکند.
این کتاب از طریق مثالهای عملی و توضیحات مفصل، رویکردی گام به گام برای تسلط بر هنر جدال دادهها، از تکنیکهای اولیه تا استراتژیهای پیشرفته، ارائه میکند. چه یک مبتدی یا یک متخصص داده با تجربه باشید، این کتاب به شما کمک می کند مهارت خود را در مدیریت داده ها و استخراج بینش های ارزشمند برای تصمیم گیری و تجزیه و تحلیل افزایش دهید.
در ادامه مقدمهای از کتاب Data Wrangling Using Pandas, SQL, and Java را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Data Wrangling Using Pandas, SQL, and Java:
ارزش پیشنهادی برای این کتاب چیست؟
این کتاب حاوی مقدمهای سریع برای اطلاعات مرتبط در مورد مدیریت دادهها است که میتواند به طور منطقی در کتابی با این اندازه گنجانده شود. با این حال، شما در معرض انواع ویژگیهای NumPy و Pandas، نحوه ایجاد پایگاههای داده و جداول در MySQL، و نحوه انجام بسیاری از کارهای پاکسازی دادهها و جدال دادهها خواهید بود.
برخی از موضوعات به صورت گذرا ارائه شده است که به دو دلیل عمده است. اول، مهم است که شما در معرض این مفاهیم باشید. در برخی موارد، موضوعاتی را مییابید که ممکن است علاقه شما را برانگیزد و از این رو شما را ترغیب میکند تا از طریق مطالعه شخصی در مورد آنها بیشتر بدانید. در موارد دیگر، احتمالاً با یک مقدمه کوتاه قانع خواهید شد. به عبارت دیگر، شما تصمیم میگیرید که در مورد موضوعات این کتاب به جزئیات بیشتری بپردازید یا خیر.
دوم، پرداختن کامل به تمام موضوعاتی که در این کتاب پوشش داده شده است، حجم آن را به میزان قابل توجهی افزایش میدهد و تعداد کمی از افراد زمان لازم برای خواندن مضامین فنی را دارند.
مخاطبان هدف کتاب Data Wrangling Using Pandas, SQL, and Java
این کتاب در درجه اول برای افرادی در نظر گرفته شده است که قصد دارند دانشمند داده شوند و همچنین هر کسی که نیاز به انجام وظایف پاکسازی داده دارد. این کتاب همچنین برای دستیابی به مخاطبان بینالمللی از خوانندگان با پیشینههای بسیار متنوع در گروههای سنی مختلف در نظر گرفته شده است.
از این رو، این کتاب به جای عبارات محاورهای که ممکن است برای آن خوانندگان گیجکننده باشد، از انگلیسی استاندارد استفاده میکند. افراد با انواع مختلف تقلید، که شامل خواندن، نوشتن، یا شنیدن مطالب جدید میشود، یاد میگیرند. این کتاب این نکات را در نظر میگیرد تا تجربه یادگیری راحت و معناداری را برای خوانندگان مورد نظر فراهم کند.
من از کتاب Data Wrangling Using Pandas, SQL, and Java چه خواهم آموخت؟
فصل اول به طور خلاصه پایتون را معرفی میکند و به دنبال آن فصل ۲، که به پردازش انواع دادههای مختلف در یک مجموعه داده، همراه با عادیسازی، استانداردسازی و مدیریت دادههای از دست رفته میپردازد. شما در مورد نقاط پرت و نحوه تشخیص آنها از طریق z-scores و تبدیل چندک خواهید آموخت. سپس با SMOTE برای مدیریت مجموعه دادههای نامتعادل آشنا خواهید شد.
فصل ۳ Pandas را معرفی میکند، که یک کتابخانه قدرتمند پایتون است که به شما امکان میدهد محتویات فایلهای CSV (و سایر فایلهای متنی) را در فریمهای داده (تا حدودی مشابه صفحات گسترده اکسل) بخوانید، جایی که میتوانید بهطور برنامهنویسی دادهها را برش دهید و تاس بزنید. مطابق با نیازهای شما
از آنجایی که مقادیر زیادی از دادهها به شکل دادههای ساختار یافته در پایگاههای داده رابطهای ذخیره میشوند، فصل ۴ شما را با مفاهیم SQL و نحوه انجام عملیات اساسی در MySQL، مانند کار با پایگاههای داده، آشنا میکند.
فصل ۵ شامل نمونه کدهای مبتنی بر جاوا برای ایجاد و دسترسی به دادهها در پایگاه داده MySQL است. فصل ۶ شما را با پاکسازی دادهها، همراه با تکنیکهای مختلف برای رسیدگی به سناریوهای مختلف، مانند دادههای از دست رفته و اطلاعات پرت آشنا میکند.
فصل هفتم این کتاب بحث جدال دادهها را توضیح میدهد و شامل اسکریپتهای پایتون و اسکریپتهای پوسته مبتنی بر awk برای حل وظایف مختلف است. در نهایت، یک پیوست برای awk وجود دارد که به شما در درک اسکریپتهای مبتنی بر awk در فصل ۷ کمک میکند.
چرا نمونههای کد عمدتاً در پایتون هستند؟
اکثر نمونههای کد کوتاه هستند (معمولاً کمتر از یک صفحه و گاهی کمتر از نیم صفحه)، و در صورت نیاز، میتوانید به راحتی و به سرعت کد را در یک نوت بوک جدید Jupyter کپی/جایگذاری کنید. برای نمونههای کد پایتون که به یک فایل CSV اشاره میکنند، برای دسترسی به فایل CSV به یک قطعه کد اضافی در نوتبوک Jupyter مربوطه نیاز دارید. علاوه بر این، نمونههای کد به سرعت اجرا میشوند، بنابراین نیازی به استفاده از GPU رایگان ارائهشده در Google Colaboratory ندارید.
اگر تصمیم به استفاده از Google Colaboratory دارید، میتوانید به راحتی کد پایتون را در یک نوت بوک کپی/پیست کنید و از ویژگی آپلود برای آپلود نوت بوکهای Jupyter موجود استفاده کنید. نکته زیر را در نظر داشته باشید: اگر کد پایتون به یک فایل CSV ارجاع میدهد، مطمئن شوید که قطعه کد مناسب (همانطور که در فصل ۱ توضیح داده شد) را برای دسترسی به فایل CSV در نوتبوک Jupyter مربوطه در Google Colaboratory وارد کردهاید.
بیشتر بخوانید: کتاب Data-Driven Decision Making in Entrepreneurship
آیا باید بخشهای تئوری کتاب Data Wrangling Using Pandas, SQL, and Java را بیاموزم؟
بار دیگر، پاسخ به میزان برنامهریزی شما برای مشارکت در تجزیه و تحلیل دادهها بستگی دارد. به عنوان مثال، اگر قصد مطالعه یادگیری ماشین را دارید، احتمالاً یاد خواهید گرفت که چگونه یک مدل ایجاد و آموزش دهید، که کاری است که پس از انجام وظایف پاکسازی دادهها انجام میشود. به طور کلی، اگر قصد دارید مهندس یادگیری ماشین شوید، احتمالاً باید همه چیزهایی را که در این کتاب با آن مواجه میشوید، یاد بگیرید.
بیشترین بهره را از این کتاب ببرید:
برخی از برنامهنویسان از نثر به خوبی یاد میگیرند، برخی دیگر از نمونه کد (و بسیاری از آنها) به خوبی یاد میگیرند، به این معنی که هیچ سبک واحدی وجود ندارد که برای همه قابل استفاده باشد.
علاوه بر این، برخی از برنامهنویسان میخواهند ابتدا کد را اجرا کنند، ببینند چه کار میکند، و سپس به کد بازگردند تا جزئیات را بررسی کنند (و برخی دیگر از روش مخالف استفاده میکنند).
در نتیجه، انواع مختلفی از نمونههای کد در این کتاب وجود دارد: برخی کوتاه، برخی طولانی، و نمونههای کد دیگر از نمونههای کد قبلی ساخته میشوند.
برای این کتاب چه چیزهایی باید بدانم؟
دانش فعلی Python ۳. x مفیدترین مهارت است. دانش سایر زبانهای برنامهنویسی (مانند جاوا) نیز به دلیل قرار گرفتن در معرض مفاهیم و ساختارهای برنامهنویسی میتواند مفید باشد. هرچه دانش فنی کمتری داشته باشید، برای درک موضوعات مختلفی که تحت پوشش قرار میگیرند، کوشش بیشتری لازم است.
اگر میخواهید مطمئن شوید که میتوانید مطالب این کتاب را درک کنید، به برخی از نمونههای کد نگاهی بیندازید تا متوجه شوید که چقدر برای شما آشناست و چقدر برای شما جدید است.
آیا این کتاب حاوی نمونه کدهای سطح تولید است؟
هدف اصلی از نمونههای کد در این کتاب، نشان دادن کتابخانههای مبتنی بر پایتون برای حل انواع وظایف مرتبط با دادهها در ارتباط با دستیابی به درک ابتدایی مفاهیم آماری است. وضوح اولویت بالاتری نسبت به نوشتن کد فشردهتری دارد که درک آن دشوارتر است (و احتمالاً بیشتر مستعد اشکال است). اگر تصمیم دارید از کدهای موجود در این کتاب در یک وب سایت تولیدی استفاده کنید، باید آن کد را با همان تجزیه و تحلیل دقیق سایر بخشهای پایه کد خود قرار دهید.
پیش نیازهای غیر فنی برای این کتاب چیست؟
اگرچه تعیین پاسخ به این سؤال دشوارتر است، اما بسیار مهم است که میل شدید به یادگیری در مورد تمیز کردن و بحث کردن دادهها، همراه با انگیزه و نظم برای خواندن و درک نمونه کدها داشته باشید.
چگونه یک پوسته فرمان را تنظیم کنم؟
اگر کاربر مک هستید، سه راه برای این کار وجود دارد. روش اول این است که از Finder برای پیمایش به Applications > Utilities استفاده کنید و سپس روی برنامه Utilities دوبار کلیک کنید. در مرحله بعد، اگر قبلاً یک پوسته فرمان در دسترس دارید، میتوانید با تایپ دستور زیر یک پوسته فرمان جدید راهاندازی کنید:
/Applications/Utilities/Terminal. app را باز کنید
روش دوم برای کاربران مک، باز کردن یک پوسته فرمان جدید در مک بوک از یک پوسته فرمان است که از قبل به سادگی با کلیک کردن روی command+n در آن پوسته فرمان قابل مشاهده است، و مک شما پوسته فرمان دیگری را راهاندازی میکند.
اگر کاربر رایانه شخصی هستید، میتوانید Cygwin (متن باز: https://cygwin.com/) را نصب کنید که دستورات bash را شبیهسازی میکند، یا از جعبه ابزار دیگری مانند MKS (یک محصول تجاری) استفاده کنید. لطفاً مستندات آنلاینی را که فرآیند دانلود و نصب را توضیح میدهد، بخوانید. توجه داشته باشید که اگر نام مستعار سفارشی در فایلی غیر از فایل راهاندازی اصلی (مانند. bash_login) تعریف شوند، بهطور خودکار تنظیم نمیشوند.
سرفصلهای کتاب Data Wrangling Using Pandas, SQL, and Java:
- Cover
- Title Page
- Copyright
- Dedication
- Contents
- Preface
- Chapter 1: Introduction to Python
- Chapter 2: Working with Data
- Chapter 3: Introduction to Pandas
- Chapter 4: RDBMS and SQL
- Chapter 5: Java, JSON, and XML
- Chapter 6: Data Cleaning Tasks
- Chapter 7: Data Wrangling
- Appendix A: Working with awk
- Index
جهت دانلود کتاب Data Wrangling Using Pandas, SQL, and Java میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.