سمحت ثغرة تم إصلاحها الآن للباحثين بتجاوز قيود شركة أبل وإجبار نموذجها اللغوي الكبير، الذي يعمل على الأجهزة لتشغيل ميزات "Apple Intelligence"، على تنفيذ إجراءات يتحكم بها المهاجم.

ويوضح منشوران على مدونة "RSAC" كيف جمع الباحثون بين استراتيجيتين هجوميتين من أجل إجبار نموذج الذكاء الاصطناعي التابع لأبل، والذي يعمل محليًا على الأجهزة، على تنفيذ تعليمات يتحكم بها المهاجم عبر حقن الأوامر.

ونجح الباحثون في استغلال الثغرة دون أن يكونوا متأكدين 100% من الطريقة التي يعالج بها نموذج أبل جزءًا من مسار تصفية المدخلات والمخرجات، نظرًا لأن "أبل" لا تكشف عن التفاصيل الدقيقة لآلية عمل نماذجها، على الأرجح لأسباب أمنية، بحسب تقرير لموقع "9to5Mac" المتخصص في أخبار التكنولوجيا، اطلعت عليه "العربية Business".

ومع ذلك، أشار الباحثون إلى أن لديهم فكرة جيدة إلى حد كبير عن الآلية التي يعمل وفقها نموذج الذكاء الاصطناعي. وقال إن السيناريو الأرجح هو أنه بعد أن يرسل المستخدم أمرًا إلى نموذج أبل المُدمج في الجهاز عبر استدعاء واجهة برمجة التطبيقات، يضمن مُرشِّح المدخلات خلو الطلب من أي محتوى غير آمن.

فإذا كان الأمر يتضمن محتوى غير آمن، يفشل الطلب. أما إذا لم يكن كذلك، فيتم تمرير الطلب إلى نموذج الذكاء الاصطناعي الفعلي العامل على الجهاز، والذي يسلّم بدوره الرد إلى مرشح الإخراج ليتحقق مما إذا كانت النتيجة تتضمن محتوى غير آمن، ليقرر بعدها إما رفض الطلب أو السماح بمروره.

كيف تم الاختراق؟

بناءً على ذلك، اكتشف الباحثون إمكانية ربط تقنيتين للاستغلال معًا لجعل نموذج أبل يتجاهل توجيهات الأمان الأساسية، وفي الوقت نفسه خداع مُرشِّحي الإدخال والإخراج للسماح بمرور المحتوى الضار.

أولًا، كتب الباحثون السلسلة الضارة بشكل معكوس، ثم استخدموا محرف يونيكود لتغيير اتجاه عرض النص بحيث يُعرض النص على شاشة المستخدم بشكل صحيح، بينما تظل معكوسة في المدخلات والمخرجات الخام التي تقوم المرشحات بفحصها.

بعد ذلك، ضمن الباحثون هذه السلسلة الضارة المعكوسة داخل طريقة هجوم ثانية تُسمى "Neural Exec"، وهي في الأساس أسلوب متقدم لتجاوز التعليمات الأصلية لنموذج الذكاء الاصطناعي واستبدالها بأي تعليمات جديدة يرغب المهاجم في تنفيذها.

نتيجةً لذلك، نجح هجوم يونيكود في تجاوز مرشحات الإدخال والإخراج، بينما تمكنت تقنية "Neural Exec" من التسبب في تغيير سلوك نموذج أبل.

وعند تقييم هذا الهجوم، وجد الباحثون أنهم حققوا نجاحًا بمعدل 75% عبر 100 أمر عشوائي.

المصدر: العربيّة

الصفحة الرئيسية

ليس عصيًا على الاختراق.. اكتشاف ثغرة تكسر قيود Apple Intelligence

كيف تم الاختراق؟

إقرأ أيضا

"ميتا" أمام القضاء من جديد في محاكمة أخرى تتعلق بإدمان مواقع التواصل

"أوبن إيه آي" تتحدى "أنثروبيك" بباقة جديدة لـ"شات جي بي تي" بـ 100 دولار

آخر الأخبار

أمن الدولة: استشهاد ١٣ عنصرًا نتيجة استهداف سراي النبطية الحكومي

إسرائيل تطرد إسبانيا من مجلس تنسيق غزة وتتهمها بـ"العدائية"