نحن فخورون ومتحمسون لمشاركة نسختين من Pangram استنادًا إلى تقنية EditLens التي اقترحناها في ورقتنا البحثية المقدمة إلى مؤتمر ICLR لعام 2026. وهذان النموذجان الخفيفان متاحان للاستخدام غير التجاري بموجب ترخيص CC BY-NC-SA 4.0 ، ويمكن تشغيلهما على جهاز MacBook.
لقد حرصنا دائمًا على متابعة أحدث التطورات في مجال الكشف عن المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي، ونرغب في تمكين الباحثين الآخرين من إحراز تقدم في هذا المجال. لقد ساهمنا سابقًا في المجتمع من خلال نشر ورقة بحثية بعنوان EditLens تعرض طرقًا مبتكرة لتحليل وتصنيف المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي، وإجراء تحليلات واسعة النطاق على المراجعات النظيرة والصحف الأمريكية، وتقديم منح API للباحثين. ومن خلال إصدار نقاط التحقق لنموذج EditLens، ومجموعة بيانات التدريب، والكود المصدري، نأمل أن يتمكن الباحثون من مواصلة البناء على أساس عملنا.
يجب أن يتطور الكشف عن الذكاء الاصطناعي بالتوازي مع تطور استخدام الذكاء الاصطناعي التوليدي. فقد كشفت دراسة حديثة أجرتها OpenAI أن ثلثي جميع الطلبات المتعلقة بالكتابة الموجهة إلى ChatGPT تتضمن تعديل نص مقدم من المستخدم بدلاً من إنشائه من الصفر. في ضوء هذا النموذج الناشئ الذي يجمع بين البشر والذكاء الاصطناعي في تأليف النصوص، قمنا بتطوير إطار عمل جديد للكشف يأخذ في الاعتبار مدى مساهمة الذكاء الاصطناعي في النص. ربما لاحظ مستخدمو Pangram أن نموذجنا يعرض نتائج مثل "بمساعدة طفيفة من الذكاء الاصطناعي" أو "بمساعدة معتدلة من الذكاء الاصطناعي". أصبحت هذه التصنيفات ممكنة بفضل التكنولوجيا المعروضة في ورقة بحثنا في ICLR 2026،"EditLens: Quantifying the Extent of AI Editing in Text"، التي تقدم نموذجًا للكشف عن الذكاء الاصطناعي يعطي درجة من 0 إلى 1، حيث تشير 0 إلى نص مكتوب بالكامل بواسطة البشر، بينما تشير 1 إلى نص تم إنشاؤه بالكامل بواسطة الذكاء الاصطناعي. مع إصدار مجموعة البيانات الخاصة بنا ورمز المصدر، يمكن لأي شخص الآن تدريب نموذج EditLens الخاص به.
نحن نطلق مجموعة بيانات EditLens التي تضم 60 ألف نموذج للتدريب، و2.4 ألف نموذج للتحقق، و6 آلاف نموذج للاختبار. ويتألف كل قسم من نصوص كُتبت بالكامل بواسطة البشر، ونصوص تم إنشاؤها بالكامل بواسطة الذكاء الاصطناعي، ونصوص تم تحريرها بواسطة الذكاء الاصطناعي، وذلك من 4 مجالات. تم إنشاء النصوص التي تم تحريرها بواسطة الذكاء الاصطناعي من خلال تطبيق موجه تحرير على نص مصدر مكتوب بواسطة البشر من أحد المجالات الخمسة التالية: الأخبار (Narayan et al., 2018 و See et al., 2017)، والكتابة الإبداعية (Fan et al., 2018)، ومراجعات Amazon (Zhang et al., 2015)، مراجعات Google (Li et al., 2022)، ومحتوى الويب المتعلق بالتعليم (Lozhkov et al., 2024).
كانت النماذج المستخدمة لإنشاء النصوص التي تم إنتاجها وتحريرها بواسطة الذكاء الاصطناعي هي نماذج OpenAI gpt-4.1-2025-04-14 ، شركة أنثروبيك كلود-سونيت-4-20250514 ، وGoogleجيميني-2.5-فلاش.
تتضمن مجموعة بيانات EditLens أيضًا قسمين للتقييم خارج المجال: 6 آلاف مثال من مجال نصي تم استبعاده (رسائل البريد الإلكتروني) ونسخة من قسم الاختبار التي أنشأتها شركة Meta Llama-3.3-70B-Instruct-Turbo .
بالإضافة إلى ذلك، ننشر مجموعة بيانات جمعناها تضم ما يقرب من 1.8 ألف نص تم تحريرها باستخدام Grammarly. تتكون هذه المجموعة من 9 تعديلات مختلفة لـ 200 نص أصلي كتبها البشر. كل تعديل من هذه التعديلات (مثل «تبسيط هذا») هو اقتراح تعديل من معالج النصوص المدمج في Grammarly. تم أخذ عينات من النصوص الأصلية المكتوبة بواسطة البشر البالغ عددها 200 نص من إحدى مجموعات البيانات التالية: Persuade 2.0 (Crossley et al., 2024)، ELLIPSE (Crossley et al., 2023)، BAWE (Nesi et al., 2004)، ICNALE (Ishikawa et al., 2007)، CLASSE (Crossley et al., 2024)، أو PIILO (Holmes et al., 2023).
يمكنك استكشاف مجموعتي البيانات هاتين على HuggingFace.
بانجرام/إيديتلنس_لاما-3.2-3B تم ضبطه باستخدام QLoRA مع طول تسلسل أقصى يبلغ 1024 رمزًا. ويحتوي النموذج الأساسي على 3 مليارات معلمة.
بانجرام/تحرير_روبرتا-كبيرتم ضبط نموذج يحتوي على 355 مليون معلمة، باستخدام طول تسلسل أقصى يبلغ 512 رمزًا.
تم تدريب كلا النموذجين لمدة دورة واحدة وفقًا للطريقة الموضحة في ورقة EditLens البحثية. يمكن العثور على المعلمات الفائقة الإضافية ورمز التدريب لكلا النموذجين في مستودع GitHub الخاص بـ EditLens. يمكنك تنزيل نقاط فحص النموذج من HuggingFace.
بالنسبة للتصنيف الثنائي والثلاثي على حد سواء، نحدد القيم الحدية من خلال المعايرة على مجموعة التحقق التي تم استبعادها.
فيما يتعلق بالتقييمات الثنائية، نحدد العتبة التي تزيد من درجة F1 إلى أقصى حد لتمييز النصوص المكتوبة بالكامل بواسطة البشر عن النصوص التي تم إنشاؤها بالكامل بواسطة الذكاء الاصطناعي. ولا توجد أي نصوص تم تحريرها بواسطة الذكاء الاصطناعي في التقييمات الثنائية.
بالنسبة للتقييمات الثلاثية، نحدد عتبتين. أولاً، نقسم بيانات التقييم إلى ثلاث فئات: «بشري»، و«الذكاء الاصطناعي»، و«معدّل بواسطة الذكاء الاصطناعي». ثم نحدد عتبة دنيا تفصل فئة «البشري» عن مجموع بيانات [الذكاء الاصطناعي، المعدّل بواسطة الذكاء الاصطناعي]، وعتبة عليا تفصل فئة «الذكاء الاصطناعي» عن مجموع بيانات [البشري، المعدّل بواسطة الذكاء الاصطناعي]. ويتم تحديد كلتا العتبتين من خلال تعظيم درجة F1.
2,038 نصًا من تأليف البشر و2,046 نصًا من تأليف الذكاء الاصطناعي
| جهاز الكشف | ماكرو F1 | FPR | FNR |
|---|---|---|---|
| بانجرام 3.2 (الطراز الحالي قيد الإنتاج) | 1.000 | 0.000 | 0.000 |
| Pangram OSS: editlens_Llama-3.2-3B | 1.000 | 0.000 | 0.000 |
| Pangram OSS: editlens_roberta-large | 0.997 | 0.002 | 0.003 |
| Fast-DetectGPT | 0.895 | 0.121 | 0.088 |
| منظار | 0.886 | 0.128 | 0.101 |
2,038 نصًا من تأليف البشر، و2,046 نصًا من تأليف الذكاء الاصطناعي، و2,031 نصًا تم تحريره بواسطة الذكاء الاصطناعي
| جهاز الكشف | الدقة | ماكرو F1 | F1 البشري | AI F1 | تم تحريره بواسطة الذكاء الاصطناعي - فورمولا 1 |
|---|---|---|---|---|---|
| بانجرام 3.2 (الطراز الحالي قيد الإنتاج) | 0.920 | 0.920 | 0.926 | 0.957 | 0.876 |
| Pangram OSS: editlens_Llama-3.2-3B | 0.895 | 0.895 | 0.895 | 0.948 | 0.842 |
| Pangram OSS: editlens_roberta-large | 0.881 | 0.881 | 0.900 | 0.923 | 0.819 |
| Fast-DetectGPT | 0.585 | 0.545 | 0.246 | 0.831 | 0.558 |
| منظار | 0.569 | 0.523 | 0.213 | 0.811 | 0.545 |
1,992 نصًا بشريًا و1,847 نصًا من إنتاج الذكاء الاصطناعي
| جهاز الكشف | ماكرو F1 | FPR | FNR |
|---|---|---|---|
| بانجرام 3.2 (الطراز الحالي قيد الإنتاج) | 0.999 | 0.001 | 0.001 |
| Pangram OSS: editlens_Llama-3.2-3B | 0.998 | 0.001 | 0.004 |
| Pangram OSS: editlens_roberta-large | 0.966 | 0.001 | 0.068 |
| Fast-DetectGPT | 0.941 | 0.079 | 0.036 |
| منظار | 0.914 | 0.155 | 0.011 |
1,992 نصًا من تأليف البشر، و1,847 نصًا من تأليف الذكاء الاصطناعي، و2,308 نصًا تم تحريره بواسطة الذكاء الاصطناعي
| جهاز الكشف | الدقة | ماكرو F1 | F1 البشري | AI F1 | تم تحريره بواسطة الذكاء الاصطناعي - فورمولا 1 |
|---|---|---|---|---|---|
| بانجرام 3.2 (الطراز الحالي قيد الإنتاج) | 0.905 | 0.909 | 0.898 | 0.956 | 0.872 |
| Pangram OSS: editlens_Llama-3.2-3B | 0.863 | 0.868 | 0.855 | 0.936 | 0.812 |
| Pangram OSS: editlens_roberta-large | 0.695 | 0.673 | 0.847 | 0.515 | 0.657 |
| Fast-DetectGPT | 0.625 | 0.589 | 0.261 | 0.886 | 0.619 |
| منظار | 0.618 | 0.575 | 0.266 | 0.857 | 0.601 |
2,038 نصًا من تأليف البشر و2,038 نصًا من تأليف الذكاء الاصطناعي
| جهاز الكشف | ماكرو F1 | FPR | FNR |
|---|---|---|---|
| بانجرام 3.2 (الطراز الحالي قيد الإنتاج) | 1.000 | 0.000 | 0.000 |
| Pangram OSS: editlens_Llama-3.2-3B | 1.000 | 0.000 | 0.000 |
| Pangram OSS: editlens_roberta-large | 0.987 | 0.002 | 0.025 |
| Fast-DetectGPT | 0.939 | 0.121 | 0.000 |
| منظار | 0.936 | 0.128 | 0.000 |
2,038 نصًا من تأليف البشر، و2,038 نصًا من تأليف الذكاء الاصطناعي، و1,881 نصًا تم تحريره بواسطة الذكاء الاصطناعي
| جهاز الكشف | الدقة | ماكرو F1 | F1 البشري | AI F1 | تم تحريره بواسطة الذكاء الاصطناعي - فورمولا 1 |
|---|---|---|---|---|---|
| بانجرام 3.2 (الطراز الحالي قيد الإنتاج) | 0.952 | 0.951 | 0.946 | 0.985 | 0.923 |
| Pangram OSS: editlens_Llama-3.2-3B | 0.921 | 0.920 | 0.918 | 0.965 | 0.877 |
| Pangram OSS: editlens_roberta-large | 0.860 | 0.859 | 0.908 | 0.879 | 0.791 |
| Fast-DetectGPT | 0.562 | 0.506 | 0.262 | 0.817 | 0.440 |
| منظار | 0.540 | 0.478 | 0.227 | 0.796 | 0.411 |
91 نصًا بشريًا
| جهاز الكشف | FPR |
|---|---|
| بانجرام 3.2 (الطراز الحالي قيد الإنتاج) | 0.000 |
| Pangram OSS: editlens_Llama-3.2-3B | 0.055 |
| Pangram OSS: editlens_roberta-large | 0.099 |
| منظار | 0.560 |
| Fast-DetectGPT | 0.670 |
150 نصًا من تأليف البشر و150 نصًا من تأليف الذكاء الاصطناعي
| جهاز الكشف | ماكرو F1 | FPR | FNR |
|---|---|---|---|
| بانجرام 3.2 (الطراز الحالي قيد الإنتاج) | 1.000 | 0.000 | 0.000 |
| Pangram OSS: editlens_Llama-3.2-3B | 0.987 | 0.027 | 0.000 |
| Pangram OSS: editlens_roberta-large | 0.960 | 0.020 | 0.060 |
| منظار | 0.846 | 0.087 | 0.220 |
| Fast-DetectGPT | 0.735 | 0.487 | 0.013 |
2,058 نصًا من تأليف البشر و7,942 نصًا من تأليف الذكاء الاصطناعي
| كاشف | ماكرو F1 | FPR | FNR |
|---|---|---|---|
| بانجرام 3.2 (الطراز الحالي قيد الإنتاج) | 0.992 | 0.002 | 0.007 |
| Fast-DetectGPT | 0.941 | 0.078 | 0.028 |
| منظار | 0.939 | 0.100 | 0.024 |
| Pangram OSS: editlens_Llama-3.2-3B | 0.930 | 0.003 | 0.062 |
| Pangram OSS: editlens_roberta-large | 0.736 | 0.007 | 0.288 |
في هذه الرسوم البيانية الصندوقية، نعرض توزيع الدرجات على مجموعة بيانات Grammarly التي جمعناها، مجمعة حسب التعديل المطبق. ونلاحظ أن EditLens تمنح درجات منخفضة جدًا، تقارب الدرجات التي يمنحها البشر، لتعديلات مثل "تصحيح أي أخطاء"، والتي تتعلق بتصحيحات بسيطة في القواعد النحوية والإملائية، في حين تُمنح التعديلات "الإضافية" مثل "اجعلها أكثر تفصيلاً" درجات أعلى.
توزيع الدرجات حسب تعليمات التحرير في Pangram OSS: editlens_Llama-3.2-3B
توزيع الدرجات حسب تعليمات التحرير في Pangram OSS: editlens_roberta-large
نشجع الباحثين على استخدام نماذج «Open Pangram» كأساس مرجعي في أبحاثهم المتعلقة بالكشف عن الذكاء الاصطناعي. ونأمل أن تمكّن مجموعات البيانات وشفرة المصدر الباحثين من تطوير عملنا.
لا يُسمح بالاستخدام التجاري لـ Open Pangram. يجب عدم استخدام نماذج Open Pangram لفرض أي نوع من سياسات استخدام الذكاء الاصطناعي في البيئات التعليمية أو المهنية. للحصول على نموذج أكثر دقة يتميز بمعدل إيجابيات خاطئة هو الأفضل في القطاع، يرجى الاتصال بنا للاطلاع على عروضنا المخصصة للمؤسسات أو للحصول على منح واجهة برمجة التطبيقات (API) للأغراض البحثية.
