کتاب Hands-On Web Scraping with Python: Extract quality data from the web using effective Python techniques, 2nd Edition (خراش دادن وب با پایتون: استخراج دادههای با کیفیت از وب با استفاده از تکنیکهای مؤثر پایتون، ویرایش دوم) راهکارهای خراش و استخراج در وب با استفاده از پایتون و کتابخانههای آن را آموزش میدهد.
در ادامه مقدمهای از کتاب Hands-On Web Scraping with Python را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Hands-On Web Scraping with Python:
Web scraping برای خراش دادن و جمعآوری دادهها از وب استفاده میشود. دادههای جمعآوری شده از خراش دادن برای تولید و شناسایی الگوهای موجود در اطلاعات استفاده میشود.
در زمینهها و بازارهای فنی – یا بهطور دقیقتر، مبتنی بر دادههای امروزی، اطلاعات سریع و قابل اعتماد تقاضای بسیار بالایی دارد. دادههای جمعآوریشده در قالب CSV یا JSON و از پایگاههای داده برای تولید دادههای بدون خطا و با کیفیت بالا پردازش میشوند، که سپس تجزیه و تحلیل میشوند، با استفاده از الگوریتمهای یادگیری ماشین آموزش داده میشوند و رسم میشوند. اطلاعات به دست آمده برای تصمیمگیری یا کارهای حمایتی مرتبط با هوش تجاری منتقل میشود.
بیشتر بخوانید: کتاب Web Scraping With Python
فصول کتاب Hands-On Web Scraping with Python به گونهای طراحی شده است که هر بخش به شما کمک میکند تا مفاهیم مهم و تجربیات عملی خاصی را درک کنید. اگر تمام فصول کتاب را کامل کنید، در استخراج دادهها از وب سایتهای مورد نظر و تجزیه و تحلیل و گزارش دادهها تمرین خواهید کرد. شما همچنین در مورد مسیرهای شغلی و مشاغل مربوط به خراش دادن وب، تجزیه و تحلیل دادهها، گزارش، تجسم و یادگیری ماشینی خواهید آموخت.
بیشتر بخوانید: کتاب Data Visualization with Python and JavaScript
کتاب Hands-On Web Scraping with Python برای چه کسی است؟
این کتاب برای برنامهنویسان پایتون، تحلیلگران داده، گزارشگران داده، متخصصان یادگیری ماشین و هر کسی که میخواهد سفر حرفهای یا یادگیری خود را در زمینه خراش دادن وب و علم داده آغاز کند، است. اگر درک اولیهای از زبان برنامهنویسی پایتون داشته باشید، به راحتی میتوانید همراه با کتاب دنبال کنید و با مفاهیم پیشرفته مرتبط با دادهها آشنا شوید.
بیشتر بخوانید: کتاب Python Real-World Projects
آنچه کتاب Hands-On Web Scraping with Python پوشش میدهد:
فصل ۱، مبانی Web Scraping، مقدمهای بر اسکراپینگ وب ارائه میکند و همچنین آخرین فناوریهای اصلی وب و تکنیکهای دادهیابی را توضیح میدهد.
فصل ۲، برنامهنویسی پایتون برای دادهها و وب، یک نمای کلی از انتخاب و استفاده از پایتون برای خراش دادن وب ارائه میدهد. این فصل از کتاب Hands-On Web Scraping with Python، همچنین وب جهانی (WWW) و عملیات مبتنی بر URL را با راهاندازی و استفاده از کتابخانهها، ابزارها و محیطهای مجازی ضروری پایتون بررسی و توضیح میدهد.
فصل ۳، جستجو و پردازش اسناد وب، یک نمای کلی و مقدمهای برای شناسایی، عبور و پردازش اسناد وب با استفاده از انتخابگرهای XPath و CSS ارائه میدهد. این فصل همچنین خراش دادن با استفاده از lxml، جمعآوری دادهها در یک فایل، تجزیه اطلاعات از robots. txt و کاوش نقشههای سایت را توضیح میدهد.
فصل ۴، خراش دادن با استفاده از Pyquery، کتابخانهای مانند jQuery برای Python، مقدمهای برای کتابخانه Python مانند jQuery ارائه میدهد: pyquery. این فصل اطلاعاتی در مورد نصب و کاوش ویژگیهای pyquery در اسناد وب ارائه میدهد. نمونههایی از خراش دادن با استفاده از pyquery و نوشتن دادهها به JSON و CSV نیز پوشش داده شده است.
فصل ۵، خراش دادن وب با سوپ اسکرپی و زیبا، یک نمای کلی و نمونههایی از استفاده و استقرار یک چارچوب محبوب خزیدن وب را ارائه میدهد: Scrapy. همچنین تجزیه و خراش را با استفاده از BeautifulSoup معرفی میکند.
فصل ۶، کار با وب امن، یک نمای کلی از برخورد با محتوای وب امن، با استفاده از جلسات و کوکیها ارائه میدهد. این فصل از کتاب Hands-On Web Scraping with Python، همچنین با پردازش مسائل مربوط به فرم HTML و احراز هویت، و همچنین ارائه راهنمای با مثالهایی از نحوه استفاده از پروکسیها در طول ارتباط HTTP، شما را از طریق پردازش محتوا راهنمایی میکند و به بررسی آن میپردازد.
فصل ۷، استخراج داده با استفاده از Web API، یک نمای کلی از وب API، مزایای آن هنگام استفاده با محتوای HTTP، همراه با قالبها و الگوهای داده موجود در API ارائه میدهد. این فصل همچنین چند نمونه از خراش دادن API وب را ارائه میدهد.
فصل ۸، استفاده از سلنیوم برای خراش دادن وب، Selenium WebDriver را معرفی میکند که به خودکار کردن اقدامات در مرورگرهای وب کمک میکند، و همچنین نحوه استفاده از سلنیوم برای خراش دادن دادهها را پوشش میدهد.
فصل ۹، استفاده از عبارات منظم و PDF، یک نمای کلی از عبارات منظم و استفاده و پیادهسازی آنها با استفاده از پایتون ارائه میدهد. این فصل از کتاب Hands-On Web Scraping with Python، همچنین نمونههایی از استخراج دادهها را با استفاده از عبارات منظم و اسناد PDF با استفاده از کتابخانه pypdf۲ Python ارائه میدهد.
فصل ۱۰، داده کاوی، تجزیه و تحلیل و تجسم، مقدمه و نمای کلی داده کاوی و تجزیه و تحلیل داده با استفاده از کتابخانه پایتون پانداها و تجسم با استفاده از Plotly را ارائه میدهد. این فصل همچنین مفهوم تجزیه و تحلیل دادههای اکتشافی را با استفاده از کتابخانه Python ydata_profiling معرفی میکند.
فصل ۱۱، یادگیری ماشین و خراش وب، مقدمهای مفصل برای یادگیری ماشین، شاخهای از هوش مصنوعی، ارائه میدهد. این فصل از کتاب Hands-On Web Scraping with Python، همچنین نمونههایی از چند موضوع یادگیری ماشین را با استفاده از کتابخانه Python-learn scikit، همراه با انجام تجزیه و تحلیل احساسات از دادههای خراشیده و جمعآوریشده ارائه میکند.
فصل ۱۲، پس از خراشیدگی – مراحل بعدی و تجزیه و تحلیل دادهها، یک نمای کلی و مقدمهای از مراحل بعدی مربوط به فناوریهای در حال رشد را ارائه میدهد و موضوعاتی مانند درخواستهای وب و پردازش دادهها را با جزئیات بیشتری پوشش میدهد. این فصل همچنین اطلاعاتی را در مورد توسعهدهندگان در کاوش در مشاغل آینده نگر و مشاغل مربوط به خراش دادن و دادهها ارائه میدهد.
سرفصلهای کتاب Hands-On Web Scraping with Python:
- Cover
- Title page
- Copyright and Credits
- Contributors
- Table of Contents
- Preface
- Part 1: Python and Web Scraping
- Chapter 1: Web Scraping Fundamentals
- Chapter 2: Python Programming for Data and Web
- Part 2: Beginning Web Scraping
- Chapter 3: Searching and Processing Web Documents
- Chapter 4: Scraping Using PyQuery, a jQuery-Like Library for Python
- Chapter 5: Scraping the Web with Scrapy and Beautiful Soup
- Part 3: Advanced Scraping Concepts
- Chapter 6: Working with the Secure Web
- Chapter 7: Data Extraction Using Web APIs
- Chapter 8: Using Selenium to Scrape the Web
- Chapter 9: Using Regular Expressions and PDFs
- Part 4: Advanced Data-Related Concepts
- Chapter 10: Data Mining, Analysis, and Visualization
- Chapter 11: Machine Learning and Web Scraping
- Part 5: Conclusion
- Chapter 12: After Scraping – Next Steps and Data Analysis
- Index
- Other Books You May Enjoy
جهت دانلود کتاب Hands-On Web Scraping with Python میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.