نظرية الألعاب.. طريقة مبتكرة لحماية البيانات الطبية الحيوية من المتسللين

إتاحة مجموعات البيانات التفصيلية للجمهور دون انتهاك خصوصية أي شخص تعد تحديا بالغ الأهمية (غيتي)

يمكن لنظرية الألعاب، التي تحاول التنبؤ بكيفية تأثير سلوك المنافسين على الخيارات التي يتخذها اللاعبون الآخرون، أن تساعد الباحثين على إيجاد أفضل الطرق لمشاركة البيانات الطبية الحيوية مع القدرة على إخفاء هوية الأشخاص الذين يتشاركون البيانات من المتسللين.

وتتطلب الأبحاث الطبية الحيوية الحديثة، مثل "ناشونال كوفيد كوهرت كولابوريتيف" (National COVID Cohort Collaborative) ومشروع الجينوم الشخصي، كميات كبيرة من البيانات الخاصة بالأفراد.

وتعد إتاحة مجموعات البيانات التفصيلية للجمهور دون انتهاك خصوصية أي شخص تحديا بالغ الأهمية لمثل هذه المشاريع.

للقيام بذلك، يقوم العديد من البرامج التي تجمع وتنشر البيانات الجينومية بإخفاء المعلومات الشخصية في البيانات التي يمكن استغلالها لإعادة تحديد الموضوعات. ومع ذلك، فمن الممكن أن يتم استخدام البيانات المتبقية لتعقب المعلومات الشخصية من مصادر أخرى، والتي يمكن أن تكون مرتبطة بالبيانات الطبية الحيوية لاكتشاف هويات الأشخاص.

على سبيل المثال، يمكن أن تؤدي مقارنة بيانات الحمض النووي لشخص ما مع قواعد بيانات الأنساب العامة مثل "أنسيستري.كوم" (Ancestry.com) في بعض الأحيان إلى الاسم الأخير للشخص، والذي يمكن استخدامه مع البيانات الديموغرافية لتعقب هوية الشخص عبر محركات البحث أو من خلال مواقع السجلات العامة على الإنترنت مثل بيبول فايندرز (PeopleFinders).

إعلان

وطوّرت مجموعة بحثية في "مركز الخصوصية والهوية الجينية في إعدادات المجتمع" (Center for Genetic Privacy and Identity in Community Settings)، طرقًا للمساعدة في تقييم وتخفيف مخاطر الخصوصية في مشاركة البيانات الطبية الحيوية.

ويمكن استخدام أساليب المجموعة البحثية لحماية أنواع مختلفة من البيانات، مثل التركيبة السكانية الشخصية أو تسلسل الجينوم، من الهجمات على إخفاء الهوية.

يمكن استخدام أساليب المجموعة البحثية لحماية أنواع مختلفة من البيانات، مثل التركيبة السكانية الشخصية أو تسلسل الجينوم، من الهجمات على إخفاء الهوية (غيتي)

نموذج القادة والتابعين

يستخدم أحدث نموذج لدى المجموعة لعبة القادة والتابعين لنمذجة التفاعلات بين موضوع البيانات ومستخدم البيانات الذي يحتمل أن يكون ضارًا.

في هذا النموذج، يتحرك موضوع البيانات أولاً، ليقرر البيانات التي يريد مشاركتها، ثم ينتقل الخصم بعد ذلك ويقرر ما إذا كان سيهاجم بناءً على البيانات المشتركة.

يتضمن استخدام نظرية الألعاب -لتقييم مناهج مشاركة البيانات- تقييم كل إستراتيجية وتأثيرها على كل من الخصوصية وقيمة البيانات المشتركة. وتتضمن الإستراتيجيات المفاضلة بين ترك أجزاء من البيانات أو حجبها لحماية الهويات والحفاظ على البيانات مفيدة قدر الإمكان.

وتسمح الإستراتيجية المثلى لموضوع البيانات بمشاركة معظم البيانات بأقل قدر من المخاطر. ومع ذلك، فإن العثور على الإستراتيجية المثلى يمثل تحديًا، لأن بيانات تسلسل الجينوم لها أبعاد عديدة، مما يجعل من غير العملي البحث الشامل في جميع إستراتيجيات مشاركة البيانات الممكنة.

وللتغلب على هذه المشكلة، قامت المجموعة البحثية بتطوير خوارزميات تركز على مجموعة فرعية صغيرة من الإستراتيجيات التي من المرجح أن تحتوي على الإستراتيجية المثلى. ولقد أثبتت هذه الطريقة فاعليتها بتحقيقها فائدة مشاركة البيانات مع الجمهور وخصوصية موضوع البيانات.

ما أهمية ذلك؟

إعلان

السيناريو الأسوأ هو حيث يمتلك المهاجم قدرات غير محدودة ولا يكترث للخسائر المالية، والتي غالبًا ما تكون غير محتملة للغاية. ومع ذلك، يركز مديرو البيانات أحيانًا على هذه السيناريوهات، مما قد يؤدي بهم إلى المبالغة في تقدير مخاطر إعادة تحديد الهوية ومشاركة بيانات أقل بكثير مما يمكنهم بداعي الأمان.

الهدف من هذا هو إنشاء نهج منظم للتفكير حول المخاطر التي تفسر أيضًا قيمة البيانات المشتركة. ولا يوفر النهج القائم على اللعبة تقديرًا أكثر واقعية لمخاطر إعادة تحديد الهوية فحسب، بل يكتشف أيضًا إستراتيجيات مشاركة البيانات التي يمكن أن تحقق التوازن الصحيح بين المنفعة والخصوصية.

مديرو البيانات يستخدمون تقنيات التشفير لحماية البيانات الطبية الحيوية (غيتي)

ما البحوث الأخرى التي يتم إجراؤها؟

يستخدم مديرو البيانات تقنيات التشفير لحماية البيانات الطبية الحيوية. وتشمل الأساليب الأخرى إضافة الضوضاء إلى البيانات وإخفاء البيانات الجزئية.

يعتمد هذا العمل على دراسة سابقة، والتي كانت رائدة في استخدام نظرية الألعاب لتقييم مخاطر إعادة تحديد الهوية ضمن البيانات الصحية والحماية من هجمات الهوية على البيانات الجينية.

والدراسة الحالية هي الأولى التي تنظر في هجوم يمكن فيه للمهاجم الوصول إلى موارد متعددة والجمع بينها بطريقة تدريجية.

ماذا بعد؟

تعمل المجموعة البحثية الآن على توسيع نهجها القائم على اللعبة لنمذجة عدم اليقين والعقلانية للاعب. كما تعمل أيضًا لحساب البيئات التي تتكون من مزودي بيانات متعددين وأنواع متعددة من مستلمي البيانات.

المصدر : مواقع إلكترونية

إعلان