داده ناشناس یکی از این اصطلاحاتی است که به هم می پیوندد و باعث می شود همه ما نسبت به تمام اطلاعاتی که در حوزه عمومی به اشتراک می گذاریم احساس بهتری داشته باشیم. هر سایتی که بازدید می کنیم از ما می پرسد که آیا کوکی های آن را می پذیریم و به محض انجام کار ، شروع به جمع آوری اطلاعات در مورد ما می کنیم.
بسیاری از سرویس ها داده هایی را از جمله گوگل ، خدمات بانکی آنلاین ، شرکت های آزمایش DNA خانگی ناشناس می کنند … این لیست به معنای واقعی کلمه بی پایان است. طی سال های بعد ، بارها و بارها به کاربران اطمینان داده شده است که پس از ناشناس ماندن ، داده های ما دیگر نمی توانند به ما مرتبط شوند.
این که آیا گمنامی شدن از طریق فرآیند حذف زمینه های شناسایی انجام می شود ، رمزگذاری یا داده ها. نظریه این بود که این داده ها هرگز نمی توانند دوباره شناسایی شوند. متأسفانه ، به نظر می رسد این مسئله کاملاً درست نیست همانطور که می خواهیم آن را دوست داشته باشیم و محققان از آن زمان تاکنون برخی از چراغ های روشن کننده و ناامید کننده را در این زمینه قرار داده اند.
ناهنجاری های ناشناس
نتایج یک پروژه تحقیقاتی ترکیبی بین محققان کالج امپریال ، لندن و دانشگاه کاتولیک دو لووین نشان می دهد که هیچکدام از روشهای فعلی ناشناس کردن داده ها نمی توانند از مجموعه بزرگ داده ها پس از انتشار در حوزه عمومی محافظت کنند. این دقیقاً خبر جدیدی نیست و تا سال 2015 ، مقاله ها در مورد ماهیت داده های ناشناس و احتمال شناسایی مجدد آن سوال می کردند.
این ممکن است همه به نظر می رسد مانند یک دسته از مزخرفات فنی است اما یکی از این موارد مقالات چهار ساله دقیقاً به همین دلیل است که باید نگران باشید و چگونه عدم ناشناس بودن داده های ناشناس بر شما تأثیر می گذارد. طبق مقاله ای که در ژانویه سال 2015 در Science منتشر شد ، افراد در مجموعه داده های تلفنی با ناشناس سازی اساسی می توانند با استفاده از تنها چهار قطعه اطلاعات خارج از مجدد شناسایی شوند ، اینها می توانند هر چیزی از یک توییت تا بررسی فیلم باشند.
زیرا بیشتر افراد از چندین استفاده می کنند دستگاه ها و خدمات متصل در طول روز ، هر یک از ما دائماً اطلاعات را به داخل اتر ارسال می کنیم. این داده ها امکان شناسایی مجدد داده های ناشناس را دارند. به عنوان مثال ، اگر یک هکر بتواند به صورتهای بانکی شما دسترسی پیدا کند ، برای مثال می تواند اطلاعات دیگری را که می تواند منجر به شناسایی مجدد اطلاعات کارت اعتباری ناشناس شود ، بدست آورد ، و آنها را یک قدم به سرقت هویت بردارد. [19659008] مطالعات موردی نه چندان ناشناس
چند سال پیش در آلمان ، یک دانشمند داده و روزنامه نگار با هم همکاری کردند تا اثبات کنند که چقدر راحت می توان را به شناسایی مجدد داده های ناشناس تبدیل کرد . با استفاده از اطلاعاتی که توسط یک کارگزار داده به آنها ارائه می شود ، این جفت ارز به لیست طولانی URL ها و نشان های زمانی دسترسی پیدا کردند که برای اکثر ما معادل نویز سفید است. با این حال ، بیشتر دقت کنید و می توانید به کل زندگی آنلاین یک فرد دسترسی پیدا کنید.
دانشمند داده آندریاس دیوز خاطرنشان می کند که اگر توییتر که به صفحه آنالیز خود مراجعه می کند ، URL حاوی نام کاربری توییتر خود در سابقه مرور آنها ظاهر می شود. پس از اتمام این امر ، مدت طولانی طول نمی کشد تا ارتباط بین داده های ناشناس و یک فرد خاص نهایی شود.
یکی دیگر از حوادث در استرالیا در سال 2017 نشان داد که دوباره شناسایی اطلاعات پزشکی از گروه داده های عمومی اما ناشناس ، جای تعجب آسان بود. به گفته یك محقق ، دکتر كولن ، از دانشگاه ملبورن ، "بیماران می توانند بدون رمزگشایی مجدداً شناسایی شوند … [using] اطلاعات شناخته شده … مانند روشهای پزشکی و سال تولد".
آخرین تحولات
نتایج حاصل از تحقیقات Université Catholique de Louvain و کالج امپریال نشان داد که حتی پیشرفته ترین تکنیک های گمنام سازی نیز کافی نبودند. علیرغم اینکه به نظر می رسد معادل دیجیتالی پیدا کردن یک سوزن در یونجه ، به نظر می رسد عادات به اشتراک گذاری داده های آنلاین ما به همه کسانی که از یک آهنربای قدرتمند مراقبت می کنند ، ارائه کرده است که ناگهان بدون در نظر گرفتن ابعاد یونجه ، به بیرون پرش می کند.
برخی از تحقیقات قبلی بر روی مجموعه داده ها که تنها ابتدایی ترین آنها در ناشناس ماندن متمرکز شده است ، این تلاش های اخیر پیشرفته ترین مجموعه داده های ناشناس را هدف قرار داده است. با این وجود ، محققان ثابت كردند كه 99.98٪ از آمریكایی ها می توانند با استفاده از 15 ویژگی مشخص كننده ، از جمله اطلاعات آزادانه در دسترس ، مانند سن ، وضعیت تأهل و جنسیت ، مجدداً به طور صحیح دوباره شناسایی شوند.
اگر کنجکاو هستید فقط درمورد چه مقدار داده های شخصی هستید در آنجا وجود دارد که می تواند دوباره شناسایی شود ، بالای صفحه گروه محرمانه بودن محاسبات در وب سایت Imperial College لندن بروید و آن را برای خودتان آزمایش کنید. از نتایج موجود در تصویر زیر ، خواهید دید که من به راحتی قابل شناسایی مجدد نیستم ، بلکه فقط به این دلیل است که هیچ یک از اطلاعاتی که وارد کردم به هیچ وجه واقعی نبوده است.
در اکثر موارد ، نتایج 80 نشان می دهد. -90٪ احتمال شناسایی مجدد ، نشان می دهد که چقدر آسان است. در حقیقت ، فقط با استفاده از چهار ویژگی تصادفی ، یعنی تاریخ تولد ، جنسیت ، کد پستی و وضعیت تأهل ، احتمال مشخص کردن فرد در حال سوسو زدن در یک سوپ داده تیره تا 95٪ می رسد.
ناشناس ، حریم خصوصی و قانون
جمع آوری و به اشتراک گذاری داده ها به طور فزاینده ای با انفجار داده های ناشی از استفاده از اینترنت و دستگاه های متصل مشکل ساز شده است. خواه از محل تلفن هوشمند شما باشد یا اطلاعات کارت اعتباری شما ، داده های حساس زیادی در مورد شما وجود دارد ، و فقط قبل از اینکه کسی آن را به نفع خود استفاده کند ، ممکن است زمان باشد.
به نظر می رسد قوانین جدید و قوانین محافظت از داده ها هر روز ظهور می کنند ، اما آنها چقدر مؤثر هستند؟ به نظر می رسد تصمیم اتحادیه اروپا برای پذیرش آیین نامه عمومی حمایت از داده ها اقدامی در جهت صحیح است ، اما ، به گفته کارشناسان ، به اندازه کافی پیش نمی رود. GDPR داده های ناشناس را به عنوان "داده هایی که ناشناس هستند به گونه ای توصیف می کند که سوژه داده ها قابل شناسایی یا دیگر شناسایی نشوند". دلگرم کننده است ، اما ما قبلاً دیدیم که این تئوری چقدر نقص است. نگران کننده تر این است که GDPR داده های ناشناس را دیگر شخصی نمی داند ، یعنی می تواند بدون توجه یا اجازه سوژه ها به اشتراک گذاشته شود ، مورد استفاده قرار بگیرد و به فروش برسد.
طبق گفته محققان در مورد آخرین یافته ها ، اقدامات ارائه شده است. در سطح ملی ، و همچنین مواردی که با قانون GDPR وارد شده اند ، وقتی قدردانی می کنند که از شناسایی مجدد اطلاعات خطر ناشی می شوند ، به اندازه کافی دور نمی شوند. حتی GDPR میزان شناسایی مجدد ریسک یا احتمال تهدیدهای جدید در آینده را نشان نمی دهد.
تا آنجا که به کارشناسان مربوط می شود ، قوانین جدید در مورد داده های خصوصی باید "خطر فردی را در نظر بگیرد. شناسایی مجدد و عدم امکان پذیر بودن قابل قبول – حتی اگر مجموعه داده ناقص باشد – و همچنین قانوناً طیف گسترده ای از سیستم های افزایش خصوصی حفظ حریم خصوصی و اقدامات امنیتی را که باعث می شود از داده ها استفاده شود در حالی که به طور موثر حفظ حریم شخصی افراد را می شناسند ، بشناسید. [19659002] یکی دیگر از نقص های احتمالی در تولید ناخالص داخلی ، این است که اجازه می دهد از نام مستعار در رابطه با ناشناس ماندن استفاده شود. این همه بسیار پیچیده و پیشرفته به نظر می رسد اما معنای آن این است که "داده ها بدون استفاده از اطلاعات اضافی دیگر نمی توانند به یک موضوع داده خاص اختصاص داده شوند" و اینکه چنین اطلاعات اضافی باید جداگانه در اختیار هر داده ناشناس قرار گیرد. همانطور که تحقیقات اخیر از اروپا نشان می دهد ، این مسئله بسیار دور از ذهن نیست ، به ویژه که روش های زیادی برای جمع آوری و دسترسی به داده ها وجود دارد ، بنابراین گرفتن چند بیت اطلاعات اضافی و استفاده از آنها برای شناسایی مجدد داده ها چندان دشوار نیست. 19659008] مزایای داده های ناشناس
پس از مطالعه زیاد در مورد مشکلات داده های ناشناس ، ممکن است جای تعجب باشد که فهمید که این فواید فوایدی دارد – نه فقط برای موضوع. ناشناس ماندن داده ها بدان معناست که همانطور که قبلاً نیز اشاره کردیم ، بدون رضایت افراد می توان داده ها را به صورت آزاد به اشتراک گذاشت ، ذخیره ، خرید و فروش کرد. این امر باعث می شود دسترسی به تحقیقات ، چه پزشکی و چه بازاریابی ، بسیار قابل دسترس تر و به همین دلیل مفید باشد.
آزمایش DNA خانگی ، به عنوان مثال ، برخی از بانکهای اطلاعاتی عظیم DNA را به وجود آورده است ، که همه آنها حاوی داده های ناشناس هستند اما به محققان دسترسی می دهند. به میلیون ها نمونه DNA و ویژگی های شخصیتی مربوط به آنها. احتمال تطابق رشته DNA با فرد در بانک اطلاعاتی میلیون ها نفر عملاً غیرممکن است ، به این معنی که اثر انگشت ژنتیکی شما بی خطر است و هرگز نمی تواند با شما مرتبط باشد. در عین حال ، از داده های ناشناس شما می تواند برای ایجاد اکتشافات مهم و حتی توسعه درمان بیماری های در حال حاضر غیرقابل تحمل استفاده شود.
نکته منفی استفاده از داده های ناشناس برای تحقیقات این است که اگر بیش از حد ناشناس باشد ، بسیار مفید نیست. هرچه خصوصیات بیشتر به داده ها متصل شود ، از آن سودمندتر باشد ، اما خصوصیات بیشتری در آن وجود داشته باشد ، برای شناسایی مجدد داده ها ساده تر ، و آن را به یک وضعیت کلاسیک گرفتن 22 تبدیل می کند.
نکته مهم دیگر این است که از آنجا که بسیاری از افراد ، حداقل در آمریکا ، DNA خود را آزمایش کرده اند و نمونه های آنها در یک مجموعه داده ناشناس قرار داده شده است ، کارشناسان می گویند در واقع فرقی نمی کند که شما آزمایش کرده باشید یا نه ، " می توان را شناسایی کرد زیرا پایگاه داده ها قبلاً بخش های بزرگی از ایالات متحده را پوشش می دهند [population] ".
بنابراین ، ناشناس یا در غیر این صورت ، تست شده یا نه ، رضایت داده شده یا رد شده ، داده های شما در آنجا وجود دارد و هر احتمال وجود دارد
خطرات شناسایی مجدد
مشکل اصلی شناسایی مجدد این است که می توان از آن سوءاستفاده کرد همانطور که در رسوایی فیس بوک استفاده شده است. در اوایل سال گذشته ، معلوم شد که کمبریج آنالیتیکا داده های شخصی را از سایت رسانه های اجتماعی بدون رضایت کاربران خود جمع کرده است.
گفته می شود که اطلاعات جمع آوری شده شامل داده های حساس مانند مشخصات عمومی فیس بوک کاربر ، مکان ، تاریخ تولد ، و صفحه لایک همراه با سایر اطلاعات قانونی برداشت شده در مورد کارتهای وفاداری ، مجلات مورد علاقه و سایر گزینه های انتخاب شیوه زندگی ، امکان ساختن مشخصات روانشناختی برای هر فرد فراهم شد. این ویژگی مشخصات كافی از شخص را در اختیار شما قرار می دهد تا نشان دهد كه [ چه نوع تبلیغی برای ترغیب یك شخص خاص در یك مکان خاص برای برخی از وقایع سیاسی مؤثر است .
ممکن است نسبتاً خوش خیم به نظر برسد. برخی معتقدند داده های خصوصی حتی با ارزش تر از مالی است. نقض داده های فیس بوک نه تنها تهاجمی بلکه همچنین نشان داد که چگونه به راحتی می توان چنین اطلاعاتی جمع آوری شد و به طور بالقوه برای دستکاری و یا سوء استفاده افراد از طریق سوء استفاده از آن استفاده می شود.
این تنها یکی از بسیاری از خطرات شناسایی مجدد است. دسترسی هکر به تمام اطلاعات مالی شما و سرقت هویت شما یکی دیگر از مواردی است. یکی از محققان درگیر جدیدترین مطالعه ، ایو الکساندر دو مونتوئیز ، مطالعات قبلی را انجام داده است که نشان می دهد داده های کارت اعتباری ناشناس با استفاده از تنها چهار قطعه اطلاعات اضافی می توانند 90٪ از افراد را دوباره شناسایی کنند. این یک هدیه به مجرمان سایبری در سراسر جهان است!
اما مهمتر از خطرات واقعی شناسایی مجدد این است که چگونه این حق اساسی ما برای حفظ حریم خصوصی را نقض می کند. اگرچه این ممکن است نسبتاً بی ضرر به نظر برسد ، طبق یافته های مختلف حقوقی ، افراد محروم از تجربه حریم خصوصی "[ رنج ذهنی ". علاوه بر این ، برخی از اطلاعات خصوصی می توانند به ما یا در آینده یا به آینده آسیب برساند. تصور کنید که گزینه های تولید مثل شما یا ترجیحات جنسی بر خلاف میل شما به جهان پخش شده است!
بیش از هر چیز دیگر ، با این حال ، خطر واقعی ناکامی در ناشناس ماندن این است که این امکان را به همه می دهد ، از همسایگان گرفته تا بدترین دشمنان شما ، امکان دسترسی. خصوصی ترین اطلاعات شما بدون رضایت شما.
Find the Balance
یكی از مشكلات ناشناس ماندن این است كه بیش از حد داده ها را تقریباً كمی ارائه می دهد در حالی كه خیلی كم آن را به راحتی قابل شناسایی مجدد می كند. پیش رویم ، یکی از مهمترین مسائل مربوط به قانون حفظ حریم خصوصی یا قانون حمایت از داده ها ، نحوه توازن این دو خواسته است. هیچ یک از ما نمی خواهیم جریان اطلاعات پزشکی را محدود کند اگر این به معنای کاهش رنج انسان است و در عین حال ، برای بسیاری از ما ، اسرار پزشکی ما برخی از ارزشمندترین و حساس ترین ماست.
به عنوان محقق استرالیایی ، دارایی دکتر تاگ ، "قانونگذاری در برابر شناسایی مجدد ، مشکلات ریاضی را پنهان می کند ، نه حل می کند ، و تأثیر خنک کننده هم در تحقیقات علمی و هم در گفتمان های عمومی گسترده تر خواهد داشت." ثابت کردید که ناشناس ماندن کار نمی کند و اطلاعات خصوصی شما لزوماً ایمن نیستند زیرا ناشناس است. بنابراین بهترین راه برای حل این مشکل این است که تلفن هوشمند خود را دور بیندازید و هرگز دوباره به اینترنت نروید. دقیقاً عملی نیست ،؟ با این حال ، برخی از ابزارهای امنیت سایبر در دسترس است که حداقل می تواند اثر دیجیتالی شما را پیکسل کند و پیگیری آن را سخت تر کند ، حتی اگر نتواند آن را به طور کامل از بین ببرد.
A VPN ، به عنوان مثال ، می تواند مکان و IP خود را مخفی کنید ، بنابراین این دو عامل بالقوه شناسایی شده در آنجا مناسب هستند. بسیاری از برنامه های ضد ویروس محافظت از سرقت هویت پیشرفته را ارائه می دهند ، در حالی که برخی از خدمات چک کردن پس زمینه به شما امکان دسترسی به اطلاعات وب تاریک را می دهند ، بنابراین می توانید ببینید کدام یک از اسرار شما در حوزه عمومی قرار دارد. اگرچه این ابزارها قصد حل مسئله را ندارند ، اما حداقل می توانند تصویر بزرگتر را مختل کنند و شما را با داشتن یا بدون داده های ناشناس شما سخت تر کند. با این وجود ، در پایان روز ، هرچه اطلاعات کمتری به شما بدهد ، کمتر عوامل شناسایی در مکانهای عمومی آویزان می شوند و باعث ناراحتی خود می شوند.
ناشناس خصوصی نیست
تنها نمونه ای که در آن داده های ناشناس شناخته می شوند. در واقع اگر سه ملاک زیر را رعایت کنید ، از خصوصیات خود محافظت کنید:
- یک فرد را نمی توان جدا کرد
- هیچ نقطه ای از داده ها را نمی توان به منظور ایجاد یک پروفایل فردی کامل تر مرتبط کرد.
- تعیین یک ویژگی از این امکان پذیر نیست.
متأسفانه ، این معیارها به ندرت رعایت می شود ، و کارگزاران داده های بزرگ تمام تلاش خود را می کنند تا آن نقاط را به هم پیوند دهند و نمایه ای جامع و با ارزش تر ایجاد کنند.
از آنجا که داده ها به عنوان روغن جدید خوانده می شود ، بسیار باقی مانده است. با ارزش و تلاش برای حفظ امنیت و امنیت شما سخت تر می شود. با این وجود ، استفاده از برخی اقدامات امنیتی سایبری ضرری نخواهد داشت و مطمئناً آسان تر از رها کردن تلفن و کنار گذاشتن زندگی آنلاین کاملاً آسان خواهد بود.
دفعه دیگر که یک پاپ آپ را در یک وب سایت مشاهده می کنید به شما اطلاع می دهد که سرپرست ممکن است ناشناس باشد. داده های مربوط به اشخاص ثالث ، بعد از همه ، دوباره درباره رضایت خود فکر کنید ، آیا محتوای آن وب سایت ارزش به خطر انداختن حریم خصوصی شما را دارد؟ ناشناس است یا نه ، برادر بزرگ شما را تماشا می کند ، اما هنوز هم چقدر برای او فاش می کنید.
