کتاب Getting Started with Natural Language Processing (شروع با پردازش زبان طبیعی) از جدیدترین و کاملترین منابع آموزش NLP یا پردازش زبان طبیعی است. این کتاب در 11 فصل به آموزش این علم پرداخته و همچنین برخی از الگوریتمهای آن را با استفاده از کتابخانههای زبان برنامهنویسی پایتون پیادهسازی میکند.
در ادامه مقدمهای از کتاب Getting Started with Natural Language Processing را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Getting Started with Natural Language Processing:
از اینکه شروع به پردازش زبان طبیعی را انتخاب کردید متشکریم. من بسیار هیجانزده هستم که تصمیم گرفتید با کمک این کتاب در مورد پردازش زبان طبیعی (NLP) بیاموزید، و امیدوارم از شروع کار با NLP با پیروی از این مطالب و مثالها لذت ببرید.
پردازش زبان طبیعی به انواع مختلفی از وظایف مربوط به زبان و پردازش اطلاعات بیان شده در زبان انسان میپردازد. این رشته و تکنیکها برای مدت طولانی وجود داشتهاند و به خوبی در زندگی روزمره ما ادغام شدهاند.
در واقع، شما احتمالاً بدون اینکه متوجه شوید روزانه از NLP بهرهمند میشوید. بنابراین، من واقعا نمیتوانم بر اهمیت و تأثیری که این فناوری بر زندگی ما میگذارد تأکید کنم. فصل اول این کتاب به شما یک نمای کلی از دامنه وسیع برنامههای NLP که ممکن است به طور منظم از آنها استفاده میکنید ارائه میدهد – از موتورهای جستجوی اینترنتی گرفته تا فیلترهای هرزنامه گرفته تا صفحه کلیدهای پیشبینیکننده (و بسیاری موارد دیگر!) و بقیه کتاب به شما کمک میکند. برای پیاده سازی بسیاری از این برنامهها از ابتدا خودتان.
در سالهای اخیر، این رشته بیشتر و بیشتر مورد توجه و توجه قرار گرفته است. چندین دلیل برای این وجود دارد: از یک طرف، به لطف اینترنت، ما اکنون به حجم فزایندهای از دادهها دسترسی داریم. از سوی دیگر، به لطف پیشرفتهای اخیر در سختافزار و نرمافزار رایانه، فناوری قدرتمندتری برای پردازش این دادهها داریم. پیشرفتهای اخیر در یادگیری ماشینی و یادگیری عمیق نیز به اهمیت روزافزون NLP کمک کرده است.
این روزها، شرکتهای بزرگ فناوری در حال درک پتانسیل استفاده از NLP هستند و کسبوکارها در حوزههای فناوری حقوقی، مالی، بیمه، مراقبتهای بهداشتی و بسیاری از بخشهای دیگر روی آن سرمایهگذاری میکنند. دلیل آن واضح است – زبان ابزار اصلی ارتباط در همه حوزههای زندگی است، بنابراین توانایی پردازش کارآمد اطلاعات بیان شده در قالب زبان انسانی همیشه یک مزیت است. این باعث میشود کتابی در مورد NLP بسیار به موقع باشد.
هدف من از این کتاب این است که شما را با طیف گستردهای از موضوعات مرتبط با زبان طبیعی و پردازش آن آشنا کنم و نشان دهم که چگونه و چرا این موارد در کاربردهای عملی اهمیت دارند – چه پروژه کوچک خودتان یا یک پروژه در سطح شرکت که میتواند از استخراج و استفاده از اطلاعات متون بهرهمند شوند.
من بیش از یک دهه است که در NLP کار میکنم و قبل از اینکه به NLP روی بیاورم، عمدتاً روی زبان شناسی و مطالعات نظری زبان متمرکز بودم. با نگاهی به گذشته، آنچه بیش از همه مرا در مورد روی آوردن به حوزه فنیتر NLP برانگیخت و هیجان زده کرد، فرصتهای باورنکردنی جدیدی بود که توسط فناوری و سهولت کار با دادهها و دریافت اطلاعات مورد نیاز از متون، چه در زمینه، در اختیارم قرار گرفت.
مطالعات آکادمیک در مورد خود زبان یا در زمینه کاربردهای عملی در هر حوزه دیگری. هدف این کتاب ایجاد همین اثر است. این بسیار تمرین محور است و هر مفهوم مرتبط با زبان، هر تکنیک و هر کار با کمک مثالهای واقعی توضیح داده میشود.
بیشتر بخوانید: کتاب Real-World Natural Language Processing
در مورد کتاب Getting Started with Natural Language Processing
هدف اصلی من از این کتاب این است که به شما کمک کنم تا متوجه شوید که رشته NLP چقدر هیجانانگیز است، امکانات کار در این زمینه چقدر نامحدود است، و در حال حاضر موانع ورود چقدر کم است.
هدف من این است که به شما کمک کنم تا به راحتی در این زمینه شروع کنید و نشان دهم که چه طیف گستردهای از برنامههای کاربردی مختلف را میتوانید در عرض چند روز پیاده سازی کنید، حتی اگر قبلاً هرگز در این زمینه کار نکردهاید.
کتاب Getting Started with Natural Language Processing میتواند هم به عنوان یک راهنمای جامع جلد به جلد از طریق طیف وسیعی از کاربردهای عملی و هم به عنوان یک کتاب مرجع اگر فقط به برخی از کارهای عملی علاقه دارید استفاده شود. زمانی که خواندن این کتاب را به پایان رساندید، به آن دست خواهید یافت
دانش در مورد وظایف ضروری NLP و توانایی تشخیص هر کار خاص در صورت مواجهه با آن در یک سناریوی واقعی. ما کارهای معروفی مانند تجزیه و تحلیل احساسات، طبقهبندی متن، جستجوی اطلاعات و بسیاری موارد دیگر را پوشش خواهیم داد.
زرادخانه کاملی از الگوریتمها و تکنیکهای NLP، از جمله ریشهبندی، واژهسازی، برچسبگذاری بخشی از گفتار و بسیاری موارد دیگر. شما یاد خواهید گرفت که چگونه طیف وسیعی از رویکردهای عملی را برای متن اعمال کنید، مانند برداری، استخراج ویژگی، یادگیری ماشینی تحت نظارت و بدون نظارت و غیره.
- توانایی ساختار یک پروژه NLP و درک اینکه کدام مراحل باید در یک پروژه عملی درگیر شوند.
- دانش جامع از NLP کلیدی، و همچنین یادگیری ماشینی، اصطلاحات.
- دانش جامع از منابع و ابزارهای موجود برای NLP.
چه کسی باید کتاب Getting Started with Natural Language Processing را بخواند؟
من این کتاب را نوشتهام تا برای توسعهدهندگان نرم افزار و مبتدیان در علم داده و یادگیری ماشین در دسترس باشد. اگر قبلاً مقداری برنامه نویسی در پایتون انجام دادهاید و با ریاضیات و جبر دبیرستانی (مثلاً ماتریسها، بردارها و عملیات اساسی مربوط به آنها) آشنا هستید، باید شروع کنید! مهمتر از همه، این کتاب هیچ دانش قبلی از زبانشناسی یا NLP را در نظر نمیگیرد، زیرا به شما کمک میکند تا آنچه را که در طول مسیر نیاز دارید بیاموزید.
نحوه سازماندهی کتاب Getting Started with Natural Language Processing: نقشه راه
دو فصل اول این کتاب شما را با زمینه پردازش زبان طبیعی و انواع برنامههای NLP موجود آشنا میکند. آنها همچنین به شما نشان میدهند که چگونه برنامه کوچک خود را با حداقل دانش و مهارتهای تخصصی در NLP بسازید. اگر علاقه مند به شروع سریع در این زمینه هستید، خواندن این دو فصل را توصیه میکنم. هر فصل بعدی با دقت بیشتری به یک برنامه خاص NLP نگاه میکند، بنابراین اگر به چنین برنامه خاصی علاقه مند هستید، میتوانید فقط روی یک فصل خاص تمرکز کنید. برای یک دید کلی از این رشته، تکنیکها و کاربردها، خواندن جلد کتاب را پیشنهاد میکنم:
فصل 1 کتاب Getting Started with Natural Language Processing – زمینه NLP را با وظایف و کاربردهای مختلف آن معرفی میکند. همچنین به طور خلاصه تاریخچه این رشته را مرور میکند و نشان میدهد که چگونه برنامههای کاربردی NLP در زندگی روزمره ما استفاده میشود.
فصل 2 کتاب Getting Started with Natural Language Processing – توضیح میدهد که چگونه میتوانید برنامه کاربردی NLP (فیلتر هرزنامه) خود را از ابتدا بسازید، و شما را در تمام مراحل ضروری در خط لوله برنامه راهنمایی کنید. در حین انجام این کار، تعدادی از تکنیکهای اساسی NLP از جمله توکنسازی و عادیسازی متن را معرفی میکند و نحوه استفاده از آنها را در عمل از طریق یک جعبه ابزار محبوب NLP به نام NLTK نشان میدهد.
فصل 3 کتاب Getting Started with Natural Language Processing – بر وظیفه بازیابی اطلاعات تمرکز میکند. چندین تکنیک کلیدی NLP را معرفی میکند، مانند حذف ریشه و کلید واژه، و نشان میدهد که چگونه میتوانید الگوریتم بازیابی اطلاعات خود را پیاده سازی کنید. همچنین توضیح میدهد که چگونه میتوان چنین الگوریتمی را ارزیابی کرد.
فصل 4 کتاب Getting Started with Natural Language Processing – به استخراج اطلاعات میپردازد و تکنیکهای اساسی دیگری مانند برچسبگذاری بخشی از گفتار، واژهسازی و تجزیه وابستگی را معرفی میکند. علاوه بر این، نشان میدهد که چگونه میتوان یک برنامه کاربردی استخراج اطلاعات با استفاده از ابزار NLP محبوب دیگری به نام spaCy ساخت.
فصل 5 کتاب Getting Started with Natural Language Processing – نحوه پیادهسازی الگوریتم پروفایل نویسنده (یا کاربر) خود را نشان میدهد و مثالها و تمرینهای بیشتری را در NLTK و spaCy به شما ارائه میدهد. علاوه بر این، این کار را به عنوان یک مشکل طبقهبندی متن ارائه میکند و نحوه پیادهسازی طبقهبندیکننده یادگیری ماشینی را با استفاده از یک کتابخانه معروف یادگیری ماشینی به نام scikit-learn نشان میدهد.
فصل 6- موضوع نمایه سازی نویسنده (کاربر) را که در فصل 5 شروع شده است، دنبال میکند. این مقاله به بررسی دقیق کار مهندسی ویژگیهای زبانی میپردازد، که یک گام اساسی در هر پروژه NLP است. این نشان میدهد که چگونه میتوان مهندسی ویژگیهای زبانی را با استفاده از NLTK و spaCy انجام داد و چگونه نتایج یک الگوریتم طبقه بندی متن را ارزیابی کرد.
فصل 7 کتاب Getting Started with Natural Language Processing- مبحث تجزیه و تحلیل احساسات را شروع میکند که یک کار بسیار محبوب NLP است. این یک رویکرد مبتنی بر واژگان را برای کار اعمال میکند. تحلیلگر احساسات با استفاده از خط لوله زبانی با spaCy ساخته شده است.
فصل 8 کتاب Getting Started with Natural Language Processing – تجزیه و تحلیل احساسات را دنبال میکند، اما برخلاف فصل 7، رویکردی مبتنی بر داده برای این کار دارد. چندین تکنیک یادگیری ماشینی با استفاده از scikit-learn استفاده میشود و مفاهیم زبانی بیشتر با استفاده از منابع زبان spaCy و NLTK معرفی میشوند.
فصل 9 کتاب Getting Started with Natural Language Processing – وظیفه طبقه بندی موضوعات را مرور میکند. برخلاف وظایف طبقهبندی متن قبلی، این یک مشکل طبقهبندی چند کلاسه است، بنابراین این فصل پیچیدگیهای این کار را مورد بحث قرار میدهد و نشان میدهد که چگونه میتوان یک طبقهبندیکننده موضوع را با scikit-learn پیادهسازی کرد. علاوه بر این، دیدگاه یادگیری ماشینی بدون نظارت را نیز در نظر میگیرد و نحوه برخورد با این کار را به عنوان یک مشکل خوشهبندی نشان میدهد.
فصل 10 کتاب Getting Started with Natural Language Processing – وظیفه مدلسازی موضوع با تخصیص دیریکله نهفته (LDA) را معرفی میکند. علاوه بر این، یک جعبه ابزار محبوب به نام gensim را معرفی میکند که به ویژه برای کار با الگوریتمهای مدلسازی موضوعی مناسب است. انگیزه رویکرد LDA، جزئیات پیادهسازی و تکنیکهای ارزیابی نتایج مورد بحث قرار میگیرد.
فصل 11 کتاب Getting Started with Natural Language Processing- این کتاب را با یکی دیگر از وظایف کلیدی NLP به نام شناسایی نهادهای نامگذاری شده (NER) به پایان میرساند. ضمن معرفی این کار، این فصل همچنین خانواده قدرتمندی از رویکردهای برچسبگذاری توالی را معرفی میکند که به طور گسترده برای وظایف NLP استفاده میشود و نشان میدهد که چگونه NER در برنامههای NLP پاییندستی ادغام میشود.
سرفصلهای کتاب Getting Started with Natural Language Processing:
- preface
- acknowledgments
- about this book
- about the author
- about the cover illustration
- 1 Introduction
- 2 Your first NLP example
- 3 Introduction to information search
- 4 Information extraction
- 5 Author profiling as a machine-learning task
- 6 Linguistic feature engineering for author profiling
- 7 Your first sentiment analyzer using sentiment lexicons
- 8 Sentiment analysis with a data-driven approach
- 9 Topic analysis
- 10 Topic modeling
- 11 Named-entity recognition
- Appendix A Installation instructions
- index
جهت دانلود کتاب Getting Started with Natural Language Processing میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.