کتاب Hands-On Differential Privacy: Introduction to the Theory and Practice Using Opendp (حریم خصوصی تفاضلی در عمل: مقدمه ای بر تئوری و عمل با استفاده از Opendp) راهنمایی کاربردی برای درک و پیادهسازی حریم خصوصی تفاضلی (DP) است، روشی برای محافظت از حریم خصوصی افراد در هنگام به اشتراک گذاشتن دادهها. DP به شما امکان میدهد دادهها را تجزیه و تحلیل کنید و آمار مفیدی را منتشر کنید، بدون اینکه هویت یا اطلاعات شخصی افراد را فاش کنید.
در ادامه مقدمهای از کتاب Hands-On Differential Privacy را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Hands-On Differential Privacy:
در این کتاب، تعریف ریاضی دقیق حریم خصوصی به نام حریم خصوصی تفاضلی (DP) را یاد خواهید گرفت. حریم خصوصی تفاضلی را میتوان برای انتشار دقیق اطلاعات آماری در مورد یک مجموعه داده بدون افشای اطلاعات مربوط به افراد خاص در مجموعه داده به کار برد.
چنین تحلیلی منجر به انتشار اطلاعاتی در مورد مجموعه داده میشود که به عنوان انتشار داده DP شناخته میشود. کتاب Hands-On Differential Privacy به شما نشان میدهد که چگونه جریانهای کاری تحلیل داده را برای مجموعههای داده حساس طراحی کنید تا حریم خصوصی را تضمین کند.
چرا حریم خصوصی تفاضلی را انتخاب کنیم؟
DP راهحل ترجیحی و قابل اعتمادی برای نیازهای خصوصیسازی داده است زیرا:
- تضمینهای DP در برابر مهاجمهایی با منابع نامحدود مانند دادههای کمکی و قدرت محاسباتی نامحدود، قدرتمند هستند.
- تضمینهای DP از نظر ریسک افراد در داده قابل تفسیر هستند.
- با انتشار دادههای بیشتر، تضمینهای DP به تدریج کاهش مییابد.
حریم خصوصی داده چیست؟
حریم خصوصی اصطلاحی است که در زندگی روزمره استفاده میشود – به تابلوهایی مانند “مالکیت خصوصی” در حیاط یا “لطفا مزاحم نشوید” روی در اتاق هتل فکر کنید. در مورد معنای این تابلوها توافق کلی وجود دارد – در مورد اول، عبور از حیاط تجاوز به حریم خصوصی تلقی میشود (و شما را به همسایهای بیملاحظه تبدیل میکند) و در مورد دوم، میتوانید انتظار داشته باشید که کارکنان هتل درِ اتاقتان را نکوبند یا وارد نشوند.
این حریم خصوصی مهمان را از بابت مزاحمت هتل تضمین میکند. به خاطر داشته باشید که به تازگی دو نمونه را دیدهاید که در آن یک فرد میتواند محدوده خصوصیای را از افراد دیگر اما نه از دولت ایجاد کند. یک تابلو “مالکیت خصوصی” یا “لطفا مزاحم نشوید” روی در اتاق هتل مطمئناً حکم بازرسی را باطل نمیکند. این موضوع به لایه دیگری در مفهوم حریم خصوصی منجر میشود – باید از خود بپرسید، “حریم خصوصی از چه کسی و تحت چه شرایطی؟”
چرا تفاضل؟
ممکن است کلمه دیفرانسیل را ببینید و بلافاصله به معادلات دیفرانسیل و مشتق فکر کنید. در حالی که این حدس معقولی است، مفهوم DP در این معنا به حسابان مرتبط نیست. بلکه، DP به مفهوم تفاوتها مرتبط است.
اصطلاح دیفرانسیل در اینجا واقعاً در مورد پنهان کردن تفاوت بین انتشار دادهها روی مجموعههای دادهای است که تنها با یک فرد متفاوت هستند.
بعد از یادگیری مبانی نظری حریم خصوصی تفاضلی، به درک انواع تکنیکهای حریم خصوصی تفاضلی و همچنین نحوه اعمال آنها در موقعیتهای واقعی زندگی دست خواهید یافت.
با این دانش، قادر خواهید بود تا جریانهای کاری داده را به جریانهای کاری داده مبتنی بر حریم خصوصی تفاضلی ترجمه کنید که قادر به تجزیه و تحلیل دادههای حساس هستند. نمونهای از این شامل آموزش مدلهای یادگیری ماشین روی مجموعههای داده حساس با اصلاح الگوریتمهای شناختهشده برای برآوردن DP است. درک اینکه چگونه و چرا حریم خصوصی تفاضلی الگوریتمها را محدود میکند، همچنین به شما کمک میکند تا آسیبپذیریها در برابر حملات به حریم خصوصی را شناسایی کنید.
تئوریهای بنیادی DP در طیف وسیعی از الگوریتمها تجسم یافتهاند و سپس آن الگوریتمها با مثالهای قابل دسترسی نشان داده میشوند.
نمونههای متعددی که در کتاب Hands-On Differential Privacy آمده است، تکنیکهای مؤثر تجزیه و تحلیل دادههای DP را در بسیاری از زمینهها بررسی میکند. این کار شامل بیش از فقط درک الگوریتمهای درگیر است؛ همچنین شما درک شهودی عمیقی از تئوریهایی که زیربنای حریم خصوصی تفاضلی و تضمینهایی که ارائه میدهد، به دست خواهید آورد.
پیادهسازی تحلیلهای داده با حفظ حریم خصوصی
در بخش مربوط به پیادهسازی، یاد خواهید گرفت که چگونه خطوط لولهی تحلیل داده با حفظ حریم خصوصی (DP) بسازید. خطوط لوله تحلیل داده، چه با حفظ حریم خصوصی و چه بدون آن، معمولاً به قطعات سادهتر و ماژولار تقسیم میشوند که اغلب قابل تعویض هستند. خطوط لوله DP به طور خاص به صورت توالیای از تبدیلهای پایدار، یک مکانیسم خصوصی و سپس پسپردازش مدل میشوند.
برای ساختن این خط لوله، باید بدانید که چه سوالی میخواهید بپرسید، چه اختلالی برای حفظ حریم خصوصی لازم است و چه مراحل پسپردازشی برای نتیجه نهایی مورد نیاز است (اختلال و پسپردازش در فصل ۲ کتاب Hands-On Differential Privacy پوشش داده شده است).
تعادل بین حریم خصوصی و سودمندی
هنگام اعمال حریم خصوصی تفاضلی، با یک تعادل بین حریم خصوصی و سودمندی مواجه خواهید شد. در حالی که میتوان با طراحی دقیق الگوریتم، این تعادل را انعطافپذیرتر کرد، اما هیچ راه گریزی از این واقعیت وجود ندارد که الگوریتم نهایی شما باید بین حریم خصوصی و سودمندی به روشی که برای موارد استفاده خاص شما منطقی است، تعادل برقرار کند.
این تعادل بین حریم خصوصی و سودمندی با نحوه پیشپردازش (احتمالاً ایجاد سوگیری) و ایجاد اختلال (ایجاد واریانس) در دادههایی که برای برآوردن DP منتشر میکنید، کنترل میشود. به طور شهودی، هرچه نویز بیشتری به یک آمار اضافه کنید، احتمال کمتری برای یادگیری مقدار واقعی آن وجود دارد.
ساختار کتاب Hands-On Differential Privacy
این کتاب مستقل است و به سه بخش تقسیم میشود. بخش اول تئوری پشت حریم خصوصی تفاضلی را تعریف و معرفی میکند و هر مفهومی را که برای آمادهسازی دادهها و اجرای انتشار داده با حفظ حریم خصوصی نیاز دارید، توضیح میدهد.
بخش دوم کتاب Hands-On Differential Privacy به کاربردها میپردازد، از پرسوجو از فرمتهای مختلف داده مانند گزارشهای جستجو تا افزودن حریم خصوصی تفاضلی به الگوریتمهای یادگیری ماشین. بخش سوم در مورد موضوعات مهم برای کاربران عملیاتی صحبت میکند، مانند درک حملات به حریم خصوصی، تنظیم پارامترهای حریم خصوصی و استقرار اولین انتشار داده با حفظ حریم خصوصی شما.
بخش ۱: مفاهیم حریم خصوصی تفاضلی
فصل ۱، با عنوان «به دنیای حریم خصوصی تفاضلی خوش آمدید»، زمینه چگونگی و چرایی ایجاد حریم خصوصی تفاضلی را توضیح میدهد و درک شهودی از نحوه عملکرد آن را ارائه میدهد.
فصل ۲، با عنوان «اصول اولیه حریم خصوصی تفاضلی»، حریم خصوصی تفاضلی را تعریف میکند و مفاهیم کلیدی را معرفی میکند. این فصل از کتاب Hands-On Differential Privacy، درک ریاضیات پشت حریم خصوصی تفاضلی و اینکه چرا این مفهوم تضمینهای قوی برای حریم خصوصی ارائه میدهد را به شما میدهد.
فصل ۳، با عنوان «تبدیلهای پایدار»، مفهوم تبدیلهای پایدار را تعریف میکند. تبدیلهای پایدار ستون فقرات تحلیلهای داده با حفظ حریم خصوصی هستند، زیرا تقریباً کل خط لوله داده را مدلسازی میکنند. تبدیلهای پایدار همچنین زمینهای را برای درک عمیقتر مکانیزمهای حفظ حریم خصوصی فراهم میکنند.
فصل ۴، با عنوان «مکانیزمهای خصوصی»، انواع مختلفی از مکانیزمهای حفظ حریم خصوصی را معرفی میکند. مکانیزمهای خصوصی، تضمینهای اساسی حریم خصوصی را ارائه میدهند که انگیزه استفاده از حریم خصوصی تفاضلی را ایجاد میکند.
این فصل از کتاب Hands-On Differential Privacy، مکانیزمهایی برای DP محلی، ایجاد اختلال در خروجی، انتخاب خصوصی و جریانهای داده را پوشش میدهد.
فصل ۵، با عنوان «تعریفهای حریم خصوصی»، به سطوح پایینتر از حریم خصوصی تفاضلی خالص و همچنین تعدادی از مکانیزمهای خصوصی که این سطوح پایینتر آن را ممکن میسازند، میپردازد.
این فصل از کتاب Hands-On Differential Privacy، همچنین درک شما از از دست رفتن حریم خصوصی را عمیقتر میکند و این امکان را برای دستیابی به ضمانتهای محکمتر حریم خصوصی هنگام پاسخ دادن به بسیاری از سوالات فراهم میکند.
بخش ۲: حریم خصوصی تفاضلی در عمل
فصل ۶ کتاب Hands-On Differential Privacy، با عنوان «ترکیبکنندههای نترس»، نشان میدهد که چگونه مکانیزمهای پیچیدهتر حریم خصوصی را میتوان از مکانیزمهای سادهتر حریم خصوصی ساخت. ابزارهایی که این مکانیزمها را ترکیب میکنند، به نام ترکیبکنندهها، از ماهیت ماژولار ذاتی الگوریتمهای DP استفاده میکنند.
این بخش از کتاب Hands-On Differential Privacy، به کاربستهای دنیای واقعی حریم خصوصی تفاضلی میپردازد. فصلهای ۷ تا ۱۰ کتاب Hands-On Differential Privacy، نحوه اعمال این تئوری را در سناریوهای مختلف نشان میدهند، از انتشار دادههای آماری گرفته تا یادگیری ماشین.
- فصل ۷، با عنوان «نگاهی به واحد حریم خصوصی»، مفاهیم معرفی شده در بخش ۱ را روی انتشار دادهی سر-تا-سر اعمال میکند. به طور خاص، ضروری است که واحد حریم خصوصی معنادار باشد و حتی در صورت مشارکتهای نامحدود، از آن محافظت شود.
- فصل ۸، با عنوان «مدلسازی آماری با حفظ حریم خصوصی تفاضلی»، حریم خصوصی تفاضلی را به مدلهای رگرسیون خطی و طبقهبندی اعمال میکند. رویکردهای متنوع زیادی برای برازش مدلها وجود دارد که هر کدام باهم مزایا و معایبی دارند.
- فصل ۹، با عنوان «یادگیری ماشین با حفظ حریم خصوصی»، تکنیکهایی برای آموزش خصوصی مدلهای یادگیری ماشین و استنتاج خصوصی روی مدلهای یادگیری ماشین را بررسی میکند.
- فصل ۱۰، با عنوان «داده مصنوعی با حفظ حریم خصوصی تفاضلی»، الگوریتمهای با حفظ حریم خصوصی برای تولید دادههای مصنوعی را معرفی میکند. این فصل از کتاب Hands-On Differential Privacy، جنبههای اصلی الگوریتمهای تولید داده مصنوعی با حفظ حریم خصوصی، و همچنین کاربردها و محدودیتهای آنها را توضیح میدهد.
بخش ۳: استقرار حریم خصوصی تفاضلی
این بخش به ملاحظات عملی برای انتشار دادهها با حفظ حریم خصوصی میپردازد. فصلهای ۱۱ تا ۱۳ کتاب Hands-On Differential Privacy، بر جنبههای کلیدی پیادهسازی متمرکز هستند، از شناسایی حملات به حریم خصوصی تا راهاندازی اولین پروژهی شما با حفظ حریم خصوصی تفاضلی.
- فصل ۱۱، با عنوان «محافظت از دادههای خود در برابر حملات به حریم خصوصی»، حملات به حریم خصوصی را نشان میدهد که میتواند برای نقض حریم خصوصی افراد در یک مجموعه داده استفاده شود.
- فصل ۱۲، با عنوان «تعریف پارامترهای از دست رفتن حریم خصوصی برای انتشار داده»، بر جنبههای مهم حریم خصوصی تفاضلی در کاربردهای دنیای واقعی تأکید میکند، از جمله نحوهی فکر کردن در مورد تنظیم پارامترهای از دست رفتن حریم خصوصی.
- فصل ۱۳، با عنوان «برنامهریزی برای اولین پروژهی DP شما»، با برجسته کردن مراحل مهم در استقرار انتشار دادهی DP، جمعبندی کل آموختههای شما در این کتاب است.
اگر کاملاً با حریم خصوصی تفاضلی آشنا نیستید، توصیه میکنیم ابتدا روی فصلهای ۱ و ۲ کتاب Hands-On Differential Privacy تمرکز کنید، سپس زمانی که با مفاهیم موجود در آنها راحت شدید، ادامه دهید. در این فصول، زبان اساسی حریم خصوصی تفاضلی را یاد خواهید گرفت و برای مفاهیم پیشرفتهتر موجود در ادامه کتاب آماده میشوید.
سرفصلهای کتاب Hands-On Differential Privacy:
- Preface
- I. Differential Privacy Concepts
- 1. Welcome to Differential Privacy
- 2. Differential Privacy Fundamentals
- 3. Stable Transformations
- 4. Private Mechanisms
- 5. Definitions of Privacy
- 6. Fearless Combinators
- II. Differential Privacy in Practice
- 7. Eyes on the Privacy Unit
- 8. Differentially Private Statistical Modeling
- 9. Differentially Private Machine Learning
- 10. Differentially Private Synthetic Data
- III. Deploying Differential Privacy
- 11. Protecting Your Data Against Privacy Attacks
- 12. Defining Privacy Loss Parameters of a Data Release
- 13. Planning Your First DP Project
- Further Reading
- A. Supplementary Definitions
- B. Rényi Differential Privacy
- C. The Exponential Mechanism Satisfies Bounded Range
- D. Structured Query Language (SQL)
- E. Composition Proofs
- F. Machine Learning
- G. Where to Find Solutions
- Index
- About the Authors
جهت دانلود کتاب Hands-On Differential Privacy میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.