الإعلان عن شراكة جديدة مع Proofig! تعرف على المزيد
يتكون سوق الكشف عن الذكاء الاصطناعي اليوم من عدة لاعبين كبار. ربما سمعت عنهم: Pangram و GPTZero و Turnitin و ZeroGPT وغيرهم.
تقوم العديد من هذه الشركات بتحديث نماذجها بشكل روتيني ونشر أرقام عن أدائها. مؤخرًا، أطلقت GPTZero تحديثًا صيفيًا للنموذج وأصدرت أرقامًا جديدة عن أدائها على مجموعة متنوعة من النماذج الجديدة. في هذه المدونة، سنقارن أداء النموذج الجديد لـ GPTZero مع كشف الذكاء الاصطناعي لـ Pangram بما في ذلك أحدث نماذج GPT-5.
| نموذج | معدل الكشف عن البانجرام | معدل الكشف عن GPTZero | كاشف أفضل |
|---|---|---|---|
| GPT-5 | 99.81% | 95.0% | بانجرام |
| GPT-5-chat-أحدث | 99.97% | غير مختبر | غير متوفر |
| GPT-5-mini | 99.92% | 92.2% | بانجرام |
| GPT-5-نانو | 99.97% | 96.1% | بانجرام |
| GPT-OSS-120b | 100.00% | غير مختبر | غير متوفر |
| GPT-OSS-20b | 99.74% | غير مختبر | غير متوفر |
| GPT4.1 | 99.48% | 96.8% | بانجرام |
| GPT4.1-mini | 99.94% | 98.7% | بانجرام |
| o3 | 99.86% | 89.9% | بانجرام |
| o3-mini | 100.00% | 98.4% | بانجرام |
| جيميني 2.5 برو | 99.91% | 95.7% | بانجرام |
| جيميني 2.5 فلاش | 99.75% | 98.2% | بانجرام |
| كلود سونيت 4 | 99.91% | 99.1% | بانجرام |
ملاحظة: لا تنشر GPTZero مجموعات بيانات التقييم الداخلية الخاصة بها للجمهور، لذا فإن هذه الأرقام ليست مأخوذة من نفس الوثائق بالضبط. علاوة على ذلك، لا تنشر GPTZero عدد الوثائق التي تختبرها، لذا لا يمكننا مقارنة الكمية أيضًا. ومع ذلك، بالنسبة لأرقام أداء Pangram، قمنا بتقييم آلاف الوثائق لكل نموذج بالإضافة إلى مجموعة متنوعة من المجالات ومخططات الاستجابة لمحاكاة الاستخدام في العالم الحقيقي.
علاوة على ذلك، لا تقتصر دقة Pangram على الإبلاغ عن معظم المستندات التي تم إنشاؤها بواسطة الذكاء الاصطناعي. Pangram هي أيضًا الشركة الرائدة في السوق في الحفاظ على معدلات منخفضة من الإيجابيات الخاطئة. إننا نولي أولوية قصوى لعدم الإبلاغ عن المستندات المكتوبة بواسطة البشر على أنها مستندات تم إنشاؤها بواسطة الذكاء الاصطناعي. فيما يلي ملخص للفرق بين معدلات الإيجابيات الخاطئة المبلغ عنها لـ Pangram و GPTZero:
| بانجرام | GPTZero | |
|---|---|---|
| معدل الإيجابية الكاذبة (٪) | 0.01% | 1% |
| معدل الإيجابية الكاذبة (#) | ~1 من كل 10,000 وثيقة | ~1 من كل 100 وثيقة |
معدل الإيجابية الكاذبة لـ GPTZero منشور مدونة
هنا نرى أداء GPTZero الذي يسجل معدل الإيجابية الكاذبة (FPR) بنسبة 1٪.
كما تبارز Pangram و GPTZero في أبحاث علمية حول الذكاء الاصطناعي خضعت لمراجعة الأقران. ويتجلى ذلك بشكل أفضل في الدراسة الحديثة التي أجرتها جامعة ماريلاند بعنوان "الأشخاص الذين يستخدمون ChatGPT بشكل متكرر في مهام الكتابة هم كاشفون دقيقون وقويون للنصوص التي ينتجها الذكاء الاصطناعي". بحثت هذه الدراسة في قدرة المعلقين البشريين الخبراء على تصنيف الفرق بين النصوص التي يكتبها البشر وتلك التي ينتجها الذكاء الاصطناعي.
كجزء من الدراسة، تمت مقارنة أداء المعلقين البشريين بأداء أجهزة الكشف المتاحة تجارياً والمفتوحة المصدر. كان أداء Pangram أفضل من أداء كل جهاز كشف بشري على حدة، وكذلك أفضل من جميع البدائل التجارية، بما في ذلك GPTZero.
| GPT-4o | كلود | |
|---|---|---|
| بانجرام | 100% | 100% |
| GPTZero | 100% | 97.6% |
| المعلق 1 | 96.7% | 100% |
| المعلق 2 | 96.7% | 100% |
| المعلق 3 | 86.7% | 80% |
| المعلق 4 | 90.0% | 96.7% |
| المعلق 5 | 93.3% | 93.3% |
لا تنتهي الاختلافات بين النموذج الرئيسي لـ Pangram و GPTZero عند هذا الحد. كلا النموذجين "متعدد اللغات"، مما يعني أنهما قادران على اكتشاف الذكاء الاصطناعي عبر لغات أخرى غير الإنجليزية. Pangram متعدد اللغات عبر جميع اللغات العشرين الأكثر استخدامًا على الإنترنت. GPTZero يدعم الإنجليزية والفرنسية والإسبانية. فيما يلي اللغات التي تم اختبار كل نموذج بها:
| اللغة | معدل الإيجابية الكاذبة في Pangram (FPR) | معدل الإيجابية الكاذبة لـ GPTZero (FPR) | معدل الكشف عن الذكاء الاصطناعي Pangram | معدل كشف الذكاء الاصطناعي GPTZero |
|---|---|---|---|---|
| الإسبانية | 0.00% | 5.6% | 100.0% | 96.4% |
| الفرنسية | 0.00% | 3.1% | 100.0% | 93.1% |
| العربية | 0.10% | غير مختبر | 100.0% | غير مختبر |
| التشيكية | 0.00% | غير مختبر | 99.89% | غير مختبر |
| الألمانية | 0.00% | غير مختبر | 99.68% | غير مختبر |
| اليونانية | 0.00% | غير مختبر | 99.79% | غير مختبر |
| فارسي | 0.00% | غير مختبر | 100.0% | غير مختبر |
| الهندية | 0.00% | غير مختبر | 99.58% | غير مختبر |
| المجرية | 0.10% | غير مختبر | 99.05% | غير مختبر |
| إيطالي | 0.00% | غير مختبر | 100.0% | غير مختبر |
| اليابانية | 0.00% | غير مختبر | 100.0% | غير مختبر |
| هولندي | 0.10% | غير مختبر | 100.0% | غير مختبر |
| بولندي | 0.00% | غير مختبر | 100.0% | غير مختبر |
| البرتغالية | 0.00% | غير مختبر | 100.0% | غير مختبر |
| روماني | 0.10% | غير مختبر | 100.0% | غير مختبر |
| روسي | 0.00% | غير مختبر | 100.0% | غير مختبر |
| السويدية | 0.00% | غير مختبر | 99.89% | غير مختبر |
| تركي | 0.00% | غير مختبر | 99.79% | غير مختبر |
| أوكراني | 0.00% | غير مختبر | 99.89% | غير مختبر |
| الأردية | 0.00% | غير مختبر | 98.84% | غير مختبر |
| فيتنامي | 0.00% | غير مختبر | 99.89% | غير مختبر |
| الصينية | 0.00% | غير مختبر | 99.89% | غير مختبر |
لمزيد من المعلومات حول أداء Pangram على النصوص متعددة اللغات، انظر هذه المدونة.
بالإضافة إلى ذلك، تم تدريب كلا النموذجين مع إيلاء اهتمام وثيق لأداء ESL، حيث يوجد خوف شائع من أن أجهزة الكشف عن الذكاء الاصطناعي قد تكون متحيزة ضد المتحدثين غير الناطقين باللغة الإنجليزية. وقد نشر كل من GPTZero و Pangram نتائج خاصة بنصوص ESL. انظر كيف يتم ترتيبها أدناه:
| معدل الإيجابية الكاذبة | حجم العينة | |
|---|---|---|
| بانجرام | 0.032% | 25,021 |
| GPTZero | 1.1% | 91 |
لمزيد من المعلومات حول نهج Pangram في التعامل مع نصوص اللغة الإنجليزية كلغة ثانية، اقرأ هذه المدونة https://www.pangram.com/blog/how-accurate-is-pangram-ai-detection-on-esl
هناك مصدر قلق آخر بالنسبة لأولئك الذين يعملون في سوق الكشف عن الذكاء الاصطناعي، وهو الأداء على النماذج غير المنشورة. مع استمرار توسع حروب الذكاء الاصطناعي، تقوم مختبرات الذكاء الاصطناعي الكبيرة والشركات الناشئة الصغيرة بإصدار نماذج مهمة بانتظام. من المهم أن تستمر حلول الكشف عن الذكاء الاصطناعي في تقديم نتائج دقيقة على النماذج التي قد لا تكون قادرة على تدريبها مباشرة.
أتاح الإصدار الأخير من GPT-5 فرصة رائعة لمعرفة ذلك! في غضون ساعات من إصدار النموذج الجديد، اختبر فريق Pangram أداء GPTZero و Pangram على مجموعة متنوعة من أنواع المطالبات. وإليك كيف قاموا بذلك:
| بانجرام | GPTZero | |
|---|---|---|
| الوثيقة 1 | 100% | 2% |
| الوثيقة 2 | 100% | 0% |
| الوثيقة 3 | 100% | 0% |
| الوثيقة 4 | 100% | 0% |
| الوثيقة 5 | 100% | 9% |
| الوثيقة 6 | 99% | 0% |
| الوثيقة 7 | 100% | 0% |
| الوثيقة 8 | 100% | 0% |
| الوثيقة 9 | 100% | 29% |
| الوثيقة 10 | 100% | 0% |
| الوثيقة 11 | 100% | 10% |
ملاحظة: أصدرت GPTZero منذ ذلك الحين تحديثًا للنموذج يدعي أنه يعمل بشكل أفضل على GPT-5! لمزيد من التفاصيل حول مقارنتنا الأصلية، يرجى الاطلاع على هذه المدونة. بالإضافة إلى ذلك، نشجع المستخدمين على إكمال اختباراتهم الخاصة لمقارنة الأداء في أي وقت.
في النهاية، لا يزال Pangram الخيار القوي والموثوق به للكشف عن المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي. سواء كانت احتياجاتك تتعلق بالتعليم أو النشر أو مراقبة المحتوى أو أي شيء أكثر تميزًا، فنحن هنا لنقدم لك خدمة كشف دقيقة وعادلة للذكاء الاصطناعي. تعرف على المزيد في مدونتنا أو تواصل معنا على info@pangram.com.
