تعد GitHub وCopilot وChatGPT وClaude مساعدات برمجية تعمل بالذكاء الاصطناعي. فهي تتيح لمطوري البرمجيات إنتاج الأكواد بوتيرة أسرع. وقد أحدث ذلك ثورة في إنتاجية المطورين. ومع ذلك، فإن هذه السرعة المتزايدة تنطوي على مخاطر خفية. فهي تؤثر على أمن سلسلة توريد البرمجيات، وقضايا حقوق النشر، ونزاهة عمليات التوظيف.
يمكن لنظام MOSS التابع لجامعة ستانفورد عمومًا تحديد ما إذا كان البرنامج النصي قد تم إنشاؤه بواسطة الذكاء الاصطناعي، لكن المطور المتمرس يمكنه تعديل ترتيب الطرق وتغيير المتغيرات ليتجنب الكشف. كما أن هذا النظام متاح للاستخدام غير التجاري فقط. ويتطلب التحديد الفعلي لما إذا كان الكود قد تم إنشاؤه بواسطة الذكاء الاصطناعي بنية تحتية متخصصة. وتدخل الآن منصات المؤسسات مثل Pangram لتوفير خدمات مخصصة للكشف عن الكود الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.
إذا كنت تتساءل:«هل يمكن الكشف عن الشفرة التي أنشأتها الذكاء الاصطناعي؟»، فإن الإجابة هي «نعم». يختلف الكشف عن الشفرة التي أنشأتها الذكاء الاصطناعي اختلافًا جوهريًا عن الكشف عن النص الذي أنشأته الذكاء الاصطناعي، كما أنه أكثر صعوبة. يتناول هذا الدليل النقاط التالية:
كشف الذكاء الاصطناعي لـ Pangram للمطورينيصعب اكتشاف الشفرة التي يُنتجها الذكاء الاصطناعي أكثر من تلك التي يكتبها الإنسان، وذلك لأن لغات البرمجة تتمتع بـ«درجات حرية» أقل؛ حيث تتوفر للمطور خيارات أقل من حيث الأسلوب والبنية. وينطبق هذا بشكل خاص عند مقارنتها بالخيارات العديدة المتاحة للمؤلف من حيث الأسلوب والبنية.
تتسم لغات البرمجة مثل C و Assembly بمتطلبات نحوية صارمة للغاية. إذا حاول الإنسان حل مشكلة ما، فقد يطور الدالة الأكثر كفاءة لحل هذه المشكلة. وقد يطور الذكاء الاصطناعي أيضًا هذا الكود نفسه، لأنها الدالة الأكثر كفاءة. وقد ينتج كل من الإنسان والذكاء الاصطناعي كودًا متطابقًا من الناحية الحسابية.
لا يحتوي النص النموذجي القياسي على الكثير من المؤشرات الإحصائية. ولن يتمكن كاشف الذكاء الاصطناعي من تصنيف هذا النوع من النصوص بثقة على أنه من إنتاج الذكاء الاصطناعي أو من تأليف بشري. وينطبق هذا أيضًا على ملفات التكوين البسيطة.
يستخدم الرؤساء التنفيذيون للتكنولوجيا وفرق العمليات القانونية أدوات الكشف عن الكود التي تعمل بالذكاء الاصطناعي للتحقق من مصادر قاعدة الكود الخاصة بهم. ويقومون بذلك للتأكد من أن مطوريهم لا ينشرون ملكية فكرية للذكاء الاصطناعي لا يمكن حمايتها بحقوق النشر، أو منطقًا خياليًا أو ضعيفًا.
في الولايات المتحدة، لا يمكن تسجيل حقوق الطبع والنشر للمحتوى الذي تم إنشاؤه بالكامل بواسطة الذكاء الاصطناعي. فإذا كان المنتج الأساسي لإحدى الشركات الناشئة قد تم إنشاؤه بالكامل بواسطة Copilot دون إشراف بشري، فقد لا تتمكن هذه الشركة من تسجيل حقوق الطبع والنشر لهذا المنتج.
يُعد كاشف الكود الذي يعتمد على الذكاء الاصطناعي خطوة أولى حاسمة في سير عمل الأمن. فإذا تم الإبلاغ عن جزء من الكود على أنه مُنتج بنسبة 100% بواسطة الذكاء الاصطناعي، فإنه يحتاج إلى مراجعة أمنية يدوية دقيقة. ويجب أن تتم هذه المراجعة قبل دمج الكود.
يستخدم مديرو التوظيف أداة كشف الغش القائمة على الذكاء الاصطناعي في المهام الفنية التي يُطلب من المرشحين إجراؤها في المنزل. ويستخدمون هذه الأداة للتأكد من أن المرشحين يفهمون المنطق الكامن وراء الحلول التي يقدمونها. فمديرو التوظيف لا يرغبون في توظيف مرشحين يكتفون بنسخ ولصق مخرجات ChatGPT، بل يبحثون عن مرشحين يفهمون المنطق الكامن وراء هذه المخرجات.
من المرجح أن يفشل المطور الذي يعتمد كليًا على نموذج اللغة الكبيرة (LLM) لاجتياز اختبار البرمجة عندما يُطلب منه تصحيح أخطاء أنظمة قديمة معقدة وغير موثقة. فالبرمجة أمر معقد. وقد يعجز المطور الذي لا يستطيع التعامل مع هذه التعقيدات دون ChatGPT عن أداء مهامه.
بدلاً من فرض حظر شامل على الذكاء الاصطناعي، يستخدم مسؤولو التوظيف أدوات الكشف لطرح أسئلة خلال المقابلات. وإليك مثال على ذلك: "أرى أن هذه الوظيفة تعتمد بشكل كبير على المساعدة التي يقدمها الذكاء الاصطناعي. هل يمكنك أن تشرح لي لماذا اختار النموذج بنية الحلقة هذه بالتحديد؟"
يلزم استخدام برامج لتحقيق دقة عالية في الكشف عن البرمجة الآلية (AI) في الحالات ذات الحجم الكبير. أما في الحالات ذات الحجم الأصغر، فيمكن للمراجعين اليدويين الكشف عن كود البرمجة الآلية من خلال البحث عن:
يتم تدريب نماذج الذكاء الاصطناعي، مثل كلود/شات جي تي بي، على تقديم المساعدة. ويؤدي ذلك إلى قيامها بإدراج تعليقات مستفيضة وغير طبيعية لكل سطر من سطور الكود. ونادراً ما يقوم المطورون البشريون بذلك، مما يجعل التعليقات من هذا النوع دليلاً على أنها من صنع الذكاء الاصطناعي.
في الأوساط الأكاديمية أو في سياقات التوظيف، غالبًا ما يبدو كود الذكاء الاصطناعي متطابقًا عبر عدة مشاركات. ويمكن لـ MOSS أن يسلط الضوء على هذا التشابه. وهذا يتيح لـ MOSS أن يكون بمثابة مؤشر ثانوي على أن النص تم إنشاؤه بواسطة الذكاء الاصطناعي. وهناك أدوات أخرى قادرة على القيام بذلك أيضًا.
للتحقق مما إذا كان الكود قد تم إنشاؤه بواسطة الذكاء الاصطناعي، يستخدم Pangram تقنية التعلم العميق. وتُستخدم تقنية التعلم العميق لتحديد البصمة الإحصائية لنماذج الذكاء الاصطناعي.
تبلغ دقة نظام «بانغرام» 96.2%. كما أن معدل الإيجابيات الخاطئة لديه يقترب من الصفر، حيث يبلغ 0.3%. ويعزى ذلك إلى حد كبير إلى تقنية التعلم العميق.
دقة بانغرام في الكود الذي يزيد طوله عن 40 سطراًعلى عكس أدوات الكشف عن الكود المكتوب بواسطة الذكاء الاصطناعي الأخرى، يتسم Pangram بطابع متحفظ عن قصد. فقد صُمم بحيث يتجاهل بعض النصوص النمطية التي يكتبها الذكاء الاصطناعي — حيث يبلغ معدل النتائج السلبية الخاطئة لـ Pangram 8.5% في مقاطع الكود الطويلة. ويهدف ذلك إلى ضمان عدم اتهامه مطورًا بشريًا زورًا بأي حال من الأحوال.
يمكن لفرق الهندسة والتوظيف دمج Pangram بسلاسة في سير عمل مؤسساتهم. ويمكنهم القيام بذلك من خلال حزمة تطوير البرامج (SDK) الخاصة بلغة Python المخصصة لاكتشاف الأكواد باستخدام الذكاء الاصطناعي من Pangram. أو يمكنهم استخدام واجهة برمجة التطبيقات (API) الخاصة بـ Pangram. ويتيح هذان الخياران إجراء فحص آلي للأكواد باستخدام الذكاء الاصطناعي ضمن سير عمل Git أو ATS الحالي.
التحقق من سلامة الكود
تعد مساعدات البرمجة التي تعمل بالذكاء الاصطناعي أدوات قوية تسرع عملية تطوير البرمجيات بجميع أنواعها. لكن لا يمكن الوثوق بها بشكل أعمى لكتابة بنية تحتية آمنة ومملوكة.
من خلال دمج أداة دقيقة للكشف عن الأكواد باستخدام الذكاء الاصطناعي في سير عملها، يمكن لفرق الهندسة والتوظيف:
تحقق من مصدر وأصالة قاعدة الكود الخاصة بك باستخدام منصة الكشف بالذكاء الاصطناعي الأكثر دقة في هذا المجال.

أليكس رويتمان هو رئيس قسم النمو في شركة «بانغرام لابس»، وهي شركة متخصصة في الكشف عن المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي. يركز عمله على الكيفية التي يعيد بها النص الذي يُنتج بواسطة الذكاء الاصطناعي تشكيل ملامح الكتابة والتعليم والثقة في شبكة الإنترنت المفتوحة.






