کتاب The Shape of Data: Geometry-Based Machine Learning and Data Analysis in R (شکل دادهها: یادگیری ماشینی مبتنی بر هندسه و تجزیه و تحلیل دادهها در R) بسیاری از الگوریتمها را از منظر هندسی برجسته میکند و ابزارهایی را در علوم شبکه، هندسه متریک و تجزیه و تحلیل دادههای توپولوژیکی از طریق کاربرد عملی معرفی میکند.
کتاب The Shape of Data یک راهنمای ابتکاری است که کاربرد تکنیکهای هندسه محور را برای یادگیری ماشین و تجزیه و تحلیل دادهها با استفاده از زبان برنامهنویسی R معرفی میکند. این کتاب تلاقی مفاهیم پیشرفته ریاضی، روششناسی محاسباتی و تجزیه و تحلیل دادههای دنیای واقعی را بررسی میکند و به خوانندگان دیدگاه جدیدی در کشف بینشها از مجموعه دادههای پیچیده ارائه میدهد.
با تمرکز بر تجزیه و تحلیل دادههای هندسی و یادگیری چندگانه، خوانندگان کشف خواهند کرد که چگونه الگوها و ساختارهای معنی دار را از دادههای با ابعاد بالا استخراج کنند، که امکان تجسم و تفسیر بیشتر اطلاعات را فراهم میکند. چه دانشمند داده، محقق یا متخصص یادگیری ماشینی باشید، این کتاب به عنوان یک همراه ضروری برای استفاده از اصول هندسی برای کشف روابط و الگوهای نهفته در مجموعه دادهها، ارتقای قابلیتهای تجزیه و تحلیل دادههای مدرن و یادگیری ماشین در یک چارچوب هندسی عمل میکند.
در ادامه مقدمهای از کتاب The Shape of Data را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب The Shape of Data:
اولین باری که من، کالین، با تردید خود در ریاضیات مواجه شدم، زمانی بود که هندسه راه حلی برای یک مشکل کلاس هنری که با آن مواجه بودم ارائه کرد: ترجمه یک نقاشی مسطح روی یک گلدان منحنی.
خطوط مستقیم از بوم دوست من روی گلدان منحنی یکسان رفتار نمیکند. فواصل بین نقاط روی نقاشی با انحنا افزایش یا کاهش یافت. ما به طور تصادفی به تفاوت بین هندسه ای که در کلاس یاد گرفته بودیم (جایی که هندسه مانند نقاشی بوم رفتار میکرد) و هندسه اشیاء دنیای واقعی مانند گلدان، برخورد کرده بودیم.
دادههای دنیای واقعی اغلب بیشتر شبیه گلدان عمل میکنند تا نقاشی بوم. من به عنوان یک دانشمند داده صنعت، با بسیاری از متخصصان غیر علوم داده کار کردهام که میخواهند روشهای جدید علم داده را بیاموزند، اما یا در مسیر شغلی خود با ریاضیات یا کدنویسی زیادی مواجه نشده اند یا ترس دائمی از ریاضیات دارند.
تجربیات آموزشی قبلی مقالات سنگین ریاضی بدون مثالهای کدگذاری اغلب مجموعه ابزارهایی را که دیگر متخصصان میتوانند برای حل مسائل مهم در زمینههای خود استفاده کنند محدود میکنند.
ریاضی زبان دیگری است که با آن میتوان دنیای اطرافمان را درک کرد. مانند هر زبانی، امکان یادگیری وجود دارد. کتاب The Shape of Data بر روی هندسه تمرکز دارد، اما یک کتاب درسی ریاضی نیست. ما از اثبات اجتناب میکنیم، به ندرت از معادلات استفاده میکنیم و سعی میکنیم تا حد امکان ریاضیات پشت الگوریتمها را سادهسازی کنیم تا این ابزارها برای مخاطبان وسیعتری قابل دسترسی باشند. اگر از نظر ریاضی پیشرفتهتر هستید و میخواهید تئوری کامل ریاضی را داشته باشید، در انتهای کتاب منابعی را ارائه میدهیم.
هندسه زیربنای تک تک الگوریتمهای یادگیری ماشین و راهاندازی مسئله است و هزاران الگوریتم مبتنی بر هندسه امروزه وجود دارد. این کتاب بر روی چند ده الگوریتم در حال استفاده تمرکز دارد، و اولویت با کسانی است که بستهها را برای پیادهسازی آنها در R دارند. در مورد مشکلاتی که از دریچه هندسه با آن مواجه میشوید، به خواندن ادامه دهید.
بیشتر بخوانید: کتاب Data Structures & Algorithms in Dart
کتاب The Shape of Data برای چه افرادی است؟
اگرچه این کتاب برای هر کسی که میخواهد یک راهنمای عملی برای علوم شبکه، جنبههای هندسه مبتنی بر یادگیری ماشین، و الگوریتمهای مبتنی بر توپولوژی، پیشینهای در آمار، یادگیری ماشین و یک زبان برنامهنویسی (در حالت ایدهآل R یا Python) باشد، است. ) مفید خواهد بود.
کتاب The Shape of Data برای موارد زیر طراحی شده است:
- متخصصان مراقبتهای بهداشتی که با مجموعههای کوچکی از دادههای بیمار کار میکنند
- دانشآموزان ریاضی به دنبال جنبه کاربردی چیزی هستند که میآموزند
- صاحبان مشاغل کوچک که میخواهند از دادههای خود برای افزایش فروش استفاده کنند
- فیزیکدانان یا شیمیدانان علاقهمند به استفاده از تجزیه و تحلیل دادههای توپولوژیکی برای یک پروژه تحقیقاتی
- جامعه شناسان کنجکاوی که نسبت به متون مبتنی بر اثبات محتاط هستند
- آماردانان یا دانشمندان داده به دنبال تقویت مجموعه ابزارهای خود هستند
- مربیان به دنبال نمونههای عملی برای نشان دادن دانشآموزان خود هستند
- مهندسین در حال توسعه به سمت یادگیری ماشین
ما بسیاری از زمینههای علم و تجارت را در مثالهای خود بررسی خواهیم کرد و دهها الگوریتم را که امروزه علم داده را شکل میدهند پوشش خواهیم داد. هر فصل از کتاب The Shape of Data بر روی شهود پشت الگوریتمهای مورد بحث تمرکز خواهد کرد و مثالهایی از نحوه استفاده از آن الگوریتمها برای حل یک مسئله با استفاده از زبان برنامهنویسی R ارائه میدهد.
در حالی که کتاب The Shape of Data با مثالهایی به زبان R نوشته شده است، مخزن قابل دانلود ما (https://nostarch.com/download/ShapeofData_PythonCode.zip) شامل کدهای R و Python برای مثالهایی است که پایتون عملکرد مشابهی برای پشتیبانی از کاربران هر دو زبان دارد. با خیال راحت به بخشهایی که بیشتر مربوط به علایق شما هستند بروید.
بیشتر بخوانید: کتاب Python 3 and Data Visualization
درباره کتاب The Shape of Data
این کتاب با مقدمه ای بر هندسه در یادگیری ماشین شروع میشود. موضوعات مرتبط با الگوریتمهای مبتنی بر هندسه از طریق یک سری فصلهای علوم شبکه ساخته میشوند که به هندسه متریک، هندسه و الگوریتمهای مبتنی بر توپولوژی و برخی از پیادهسازیهای جدیدتر این الگوریتمها در پردازش زبان طبیعی، محاسبات توزیعشده و محاسبات کوانتومی تبدیل میشوند. در اینجا مروری کوتاه بر فصول کتاب The Shape of Data آورده شده است:
فصل 1: ساختار هندسی دادهها جزئیات نحوه بررسی الگوریتمهای یادگیری ماشینی از منظر هندسی با مثالهایی از دادههای پزشکی و تصویری
فصل 2: ساختار هندسی شبکهها معیارها، ساختار و انواع دادههای شبکه را از طریق نمونههایی از شبکههای اجتماعی معرفی میکند.
فصل 3: تجزیه و تحلیل شبکه، یادگیری تحت نظارت و بدون نظارت را در مورد دادههای شبکه، الگوریتمهای خوشهبندی مبتنی بر شبکه، مقایسه شبکههای مختلف و گسترش بیماری در شبکهها معرفی میکند.
فصل 4: فیلتر شبکه از دادههای شبکه به دادههای پیچیده ساده منتقل میشود، معیارهای شبکه را به تعاملات با ابعاد بالاتر گسترش میدهد و شمارش حفرهها را در اشیایی مانند شبکهها معرفی میکند.
فصل 5: هندسه در علم داده یک نمای کلی در مورد نفرین ابعاد، نقش معیارهای فاصله در یادگیری ماشین، کاهش ابعاد و تجسم دادهها، و کاربردهای سریهای زمانی و توزیعهای احتمال ارائه میدهد.
فصل 6: کاربردهای جدیدتر هندسه در یادگیری ماشینی چندین الگوریتم مبتنی بر هندسه، از جمله یادگیری نظارت شده در دادههای آموزشی، برنامهریزی بلایای مبتنی بر هندسه، و رتبهبندی اولویتهای فعالیت را شرح میدهد.
فصل 7: ابزارهای تجزیه و تحلیل دادههای توپولوژیکی بر الگوریتمهای یادگیری بدون نظارت مبتنی بر توپولوژی و کاربرد آنها در دادههای دانشآموز تمرکز میکند.
فصل 8: الگوریتمهای هموتوپی الگوریتمی را در رابطه با برنامه ریزی مسیر و تجزیه و تحلیل دادههای کوچک معرفی میکند.
فصل 9: پروژه نهایی: تجزیه و تحلیل دادههای متنی بر مجموعه دادههای متنی، یک الگوریتم یادگیری عمیق مورد استفاده در جاسازی متن، و تجزیه و تحلیل دادههای متن پردازش شده از طریق الگوریتمهای فصلهای قبلی کتاب The Shape of Data تمرکز میکند.
فصل 10: محاسبات چند هستهای و کوانتومی به راه حلهای محاسباتی توزیع شده و الگوریتمهای کوانتومی، از جمله یک مثال علوم شبکه کوانتومی و یک الگوریتم تجزیه و تحلیل تصویر کوانتومی، میپردازد.
سرفصلهای کتاب The Shape of Data:
- Praise for The Shape of Data
- Title Page
- Copyright
- Dedication
- About the Authors
- Foreword
- Acknowledgments
- Introduction
- Chapter 1: The Geometric Structure of Data
- Chapter 2: The Geometric Structure of Networks
- Chapter 3: Network Analysis
- Chapter 4: Network Filtration
- Chapter 5: Geometry in Data Science
- Chapter 6: Newer Applications of Geometry in Machine Learning
- Chapter 7: Tools for Topological Data Analysis
- Chapter 8: Homotopy Algorithms
- Chapter 9: Final Project: Analyzing Text Data
- Chapter 10: Multicore and Quantum Computing
- References
- Index
جهت دانلود کتاب The Shape of Data میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.