الإعلان عن شراكة جديدة مع Proofig! تعرف على المزيد

هل يمكن لأجهزة الكشف عن الذكاء الاصطناعي اكتشاف GPT-4.5؟

إلياس مسرور وبرادلي إيمي
27 فبراير 2025

هل يمكن لأجهزة الكشف عن الذكاء الاصطناعي اكتشاف GPT-4.5؟ | Pangram Labs

إصدار GPT-4.5

أصدرت OpenAI اليوم GPT-4.5: أحدث وأكبر نموذج لغوي متاح، وتحديث مهم لـ ChatGPT. على الرغم من عدم تحقيق إحصائيات قياسية قابلة للمقارنة مع نماذج الاستدلال مثل DeepSeek R1 و OpenAI O3، يمثل GPT-4.5 أكبر إصدار نموذجي وأكثره توقعًا لهذا العام حتى الآن، ونحن متحمسون لاختباره. تدعي OpenAI أن هناك تحسينات كبيرة في جودة الكتابة، وقد انتشرت بالفعل تعليقات ساخنة حول الأداء على وسائل التواصل الاجتماعي.

هل يمكن لأجهزة الكشف عن الذكاء الاصطناعي مواكبة وتيرة ظهور النماذج الجديدة؟

أردنا الإجابة على السؤال الذي يتساءل عنه الكثيرون: مع تحسن النماذج، هل لا يزال بإمكاننا اكتشاف النصوص التي تم إنشاؤها بواسطة الذكاء الاصطناعي باستخدام GPT-4.5؟ أجرينا اليوم اختبارًا سريعًا لمعرفة ذلك.

Pangram مقابل المنافسة

بدأنا بأخذ عينات من 11 موجهات تشير إلى مهام الكتابة اليومية التي قد يطلبها المرء من ChatGPT.

فيما يلي المطالبات التي استخدمناها:

  1. اكتب لي مقالاً من 300 كلمة عن جهود الحفاظ على الكوالا في بيرو.
  2. اكتب لي رسالة بريد إلكتروني تشرح لفريقي أنني سأوقف نشر المقالات الافتتاحية الليبرالية في صحيفتي. اكتبها باسمي Argylle J. Baggins إلى موظفي Washington Most.
  3. اكتب لي ملخصًا من 400 كلمة يعلن عن أول أشباه موصلات في العالم تعمل في درجة حرارة الغرفة (ولكن هذه المرة بشكل حقيقي). اختلق أسماء ومختبرات عند الحاجة.
  4. اكتب مقالًا مقنعًا من وجهة نظر تلميذ في المدرسة الابتدائية مفاده أنه لا ينبغي فرض ارتداء الزي المدرسي.
  5. اكتب مذكرات معقدة لفتاة تبلغ من العمر 12 عامًا مهتمة بالشعر وبعض الفراشات خارج نافذتها.
  6. يرجى كتابة تقييم مفصل عن غرفة الهروب ذات الطابع العربي في بالتيمور بولاية ماريلاند، والتي يديرها رجل يدعى روبرت ويتميز بتصميم إنتاجي رائع.
  7. اكتب رسالة إلكترونية مقنعة من مخرج فيلم مستقل ناجح من روسيا إلى قادة جوائز الأوسكار يطلب منهم السماح لهم بالمشاركة في المسابقة على الرغم من العقوبات. اختلق التفاصيل إذا لزم الأمر.
  8. اكتب قصة خيالية إبداعية لمشهد في رواية حيث تكافح مجموعة من الشباب البالغين الأبطال من أجل الهبوط بطائرة مريخية محصنة في محاكاة لوكالة ناسا مصممة لتفشل.
  9. اكتب سيناريو لمشهد فيلم حيث يطلب رجل مالي مفلس من نيويورك من سائق أوبر في فلوريدا أن ينقذ تنين كومودو الخاص به من شقته الرخيصة المعرضة للأعاصير.
  10. اكتب قصيدة عن شابين ينفصلان وهما يرتديان أزياء تنكرية في ليلة عيد الهالوين. اجعلها مضحكة و200 كلمة.
  11. اكتب قصة خيالية إبداعية تتبع مطاردة دراجة نارية طائرة عبر مدينة البندقية في محاولة للاستيلاء على لوحة فنية لا تقدر بثمن تتأرجح بشكل خطير.

حاولنا أن نجعل المطالبات متنوعة ومتنوعة قدر الإمكان، وبالإضافة إلى ذلك، حاولنا كتابة مطالبات تظهر فرقًا نوعيًا كبيرًا عن نماذج GPT السابقة قدر الإمكان: بمعنى آخر، إذا كانت هناك فرصة للنموذج ليكون مبدعًا ويظهر عامل "الإبهار"، فقد بذلنا قصارى جهدنا لمنح GPT-4.5 تلك الفرصة.

النتائج – أجهزة الكشف عن الذكاء الاصطناعي مقابل GPT-4.5

موجهبانجرامالمنافس الرائد 1المنافس الرئيسي 2
حماية الكوالا100%100%100%
البريد الإلكتروني للصحيفة100%100%67%
أشباه الموصلات في درجة حرارة الغرفة100%56%86%
الزي المدرسي85%100%80%
يوميات الشعر100%100%15%
مراجعة غرفة الهروب100%81%56%
البريد الإلكتروني الخاص بالأفلام الروسية100%100%91%
مشهد الهبوط على المريخ100%43%7%
نص كومودو دراجون98%88%0%
قصيدة انفصال عيد الهالوين100%100%0%
مشهد مطاردة في البندقية100%49%9%

Pangram قادر على اكتشاف جميع المقالات المكتوبة بواسطة GPT-4.5 البالغ عددها 11 مقالًا، حتى بدون وجود أي بيانات GPT-4.5 في مجموعة التدريب. وبالمقارنة، فإن اثنين من المنافسين الرائدين في مجال الكشف عن الذكاء الاصطناعي يقدمان نتائج متفاوتة في أحسن الأحوال. في حين أن Pangram قادر على التنبؤ بثقة بأن 10 من أصل 11 عينة لها احتمالية 98٪ أو أعلى من الذكاء الاصطناعي، فإن المنافسين غالبًا ما يعبرون عن درجات عالية من عدم اليقين، أو في أسوأ الأحوال، يتنبأون بثقة عالية بأن النص من صنع الإنسان.

كيف يتم تعميم Pangram على النماذج الجديدة بهذه الدقة؟

Pangram هو في حد ذاته نموذج كبير للتعلم الآلي شاهد ملايين الأمثلة من النصوص التي كتبها البشر وتلك التي أنتجتها الذكاء الاصطناعي. تميل النماذج الكبيرة إلى التعميم بشكل أفضل، والتقاط الأنماط الدقيقة عبر النصوص التي أنتجها الذكاء الاصطناعي والتي لا يستطيع الآخرون التقاطها. يقلل نهج التعلم النشط لدينا من معدل الإيجابيات الخاطئة مع زيادة حساسيتنا، مما يسمح للنموذج بالعمل بشكل جيد على نطاق واسع والتعميم على نماذج LLM جديدة بشكل أكثر فعالية من منافسينا. بالإضافة إلى ذلك، فإن تركيزنا على جودة البيانات وتنوعها يؤدي في النهاية إلى نموذج يتمتع بخبرة أكبر في فهم التفاصيل الدقيقة التي لا تستطيع النماذج الأخرى التقاطها.

الخلاصة – هل لا تزال أجهزة الكشف عن الذكاء الاصطناعي تعمل مع GPT-4.5؟

نعم، لا تزال أداة الكشف عن الذكاء الاصطناعي الخاصة بنا فعالة للغاية في الكشف عن النصوص التي تم إنشاؤها بواسطة GPT-4.5.

لذا، إذا كنت تتساءل عن مدى نجاح Pangram عند ظهور نموذج جديد أكبر وأفضل، فإن Pangram يجتاز الاختبار مع الإصدار الأكثر توقعًا للذكاء الاصطناعي الذي رأيناه منذ فترة، دون الحاجة إلى أي إعادة تدريب على الإطلاق. إذا كنت لا تريد أن يتوقف برنامج الكشف عن الذكاء الاصطناعي عن العمل فجأة عند قيام OpenAI بتحديث نموذجها، فجرب Pangram اليوم.

لمزيد من المعلومات حول أبحاثنا أو للحصول على رصيد مجاني لتجربة نموذجنا على GPT-4.5، يرجى الاتصال بنا على info@pangram.com.

اشترك في نشرتنا الإخبارية
نشارك تحديثات شهرية حول أبحاثنا في مجال الكشف عن الذكاء الاصطناعي.