الإعلان عن شراكة جديدة مع Proofig! تعرف على المزيد
أصدرت OpenAI اليوم GPT-4.5: أحدث وأكبر نموذج لغوي متاح، وتحديث مهم لـ ChatGPT. على الرغم من عدم تحقيق إحصائيات قياسية قابلة للمقارنة مع نماذج الاستدلال مثل DeepSeek R1 و OpenAI O3، يمثل GPT-4.5 أكبر إصدار نموذجي وأكثره توقعًا لهذا العام حتى الآن، ونحن متحمسون لاختباره. تدعي OpenAI أن هناك تحسينات كبيرة في جودة الكتابة، وقد انتشرت بالفعل تعليقات ساخنة حول الأداء على وسائل التواصل الاجتماعي.
أردنا الإجابة على السؤال الذي يتساءل عنه الكثيرون: مع تحسن النماذج، هل لا يزال بإمكاننا اكتشاف النصوص التي تم إنشاؤها بواسطة الذكاء الاصطناعي باستخدام GPT-4.5؟ أجرينا اليوم اختبارًا سريعًا لمعرفة ذلك.
بدأنا بأخذ عينات من 11 موجهات تشير إلى مهام الكتابة اليومية التي قد يطلبها المرء من ChatGPT.
فيما يلي المطالبات التي استخدمناها:
حاولنا أن نجعل المطالبات متنوعة ومتنوعة قدر الإمكان، وبالإضافة إلى ذلك، حاولنا كتابة مطالبات تظهر فرقًا نوعيًا كبيرًا عن نماذج GPT السابقة قدر الإمكان: بمعنى آخر، إذا كانت هناك فرصة للنموذج ليكون مبدعًا ويظهر عامل "الإبهار"، فقد بذلنا قصارى جهدنا لمنح GPT-4.5 تلك الفرصة.
| موجه | بانجرام | المنافس الرائد 1 | المنافس الرئيسي 2 |
|---|---|---|---|
| حماية الكوالا | 100% | 100% | 100% |
| البريد الإلكتروني للصحيفة | 100% | 100% | 67% |
| أشباه الموصلات في درجة حرارة الغرفة | 100% | 56% | 86% |
| الزي المدرسي | 85% | 100% | 80% |
| يوميات الشعر | 100% | 100% | 15% |
| مراجعة غرفة الهروب | 100% | 81% | 56% |
| البريد الإلكتروني الخاص بالأفلام الروسية | 100% | 100% | 91% |
| مشهد الهبوط على المريخ | 100% | 43% | 7% |
| نص كومودو دراجون | 98% | 88% | 0% |
| قصيدة انفصال عيد الهالوين | 100% | 100% | 0% |
| مشهد مطاردة في البندقية | 100% | 49% | 9% |
Pangram قادر على اكتشاف جميع المقالات المكتوبة بواسطة GPT-4.5 البالغ عددها 11 مقالًا، حتى بدون وجود أي بيانات GPT-4.5 في مجموعة التدريب. وبالمقارنة، فإن اثنين من المنافسين الرائدين في مجال الكشف عن الذكاء الاصطناعي يقدمان نتائج متفاوتة في أحسن الأحوال. في حين أن Pangram قادر على التنبؤ بثقة بأن 10 من أصل 11 عينة لها احتمالية 98٪ أو أعلى من الذكاء الاصطناعي، فإن المنافسين غالبًا ما يعبرون عن درجات عالية من عدم اليقين، أو في أسوأ الأحوال، يتنبأون بثقة عالية بأن النص من صنع الإنسان.
Pangram هو في حد ذاته نموذج كبير للتعلم الآلي شاهد ملايين الأمثلة من النصوص التي كتبها البشر وتلك التي أنتجتها الذكاء الاصطناعي. تميل النماذج الكبيرة إلى التعميم بشكل أفضل، والتقاط الأنماط الدقيقة عبر النصوص التي أنتجها الذكاء الاصطناعي والتي لا يستطيع الآخرون التقاطها. يقلل نهج التعلم النشط لدينا من معدل الإيجابيات الخاطئة مع زيادة حساسيتنا، مما يسمح للنموذج بالعمل بشكل جيد على نطاق واسع والتعميم على نماذج LLM جديدة بشكل أكثر فعالية من منافسينا. بالإضافة إلى ذلك، فإن تركيزنا على جودة البيانات وتنوعها يؤدي في النهاية إلى نموذج يتمتع بخبرة أكبر في فهم التفاصيل الدقيقة التي لا تستطيع النماذج الأخرى التقاطها.
نعم، لا تزال أداة الكشف عن الذكاء الاصطناعي الخاصة بنا فعالة للغاية في الكشف عن النصوص التي تم إنشاؤها بواسطة GPT-4.5.
لذا، إذا كنت تتساءل عن مدى نجاح Pangram عند ظهور نموذج جديد أكبر وأفضل، فإن Pangram يجتاز الاختبار مع الإصدار الأكثر توقعًا للذكاء الاصطناعي الذي رأيناه منذ فترة، دون الحاجة إلى أي إعادة تدريب على الإطلاق. إذا كنت لا تريد أن يتوقف برنامج الكشف عن الذكاء الاصطناعي عن العمل فجأة عند قيام OpenAI بتحديث نموذجها، فجرب Pangram اليوم.
لمزيد من المعلومات حول أبحاثنا أو للحصول على رصيد مجاني لتجربة نموذجنا على GPT-4.5، يرجى الاتصال بنا على info@pangram.com.
