تقديم "أوبن بانجرام"

كاثرين تاي
24 مارس 2026

🤗 النماذج ومجموعات البيانات

كود المصدر

نحن فخورون ومتحمسون لمشاركة نسختين من Pangram استنادًا إلى تقنية EditLens التي اقترحناها في ورقتنا البحثية المقدمة إلى مؤتمر ICLR لعام 2026. وهذان النموذجان الخفيفان متاحان للاستخدام غير التجاري بموجب ترخيص CC BY-NC-SA 4.0 ، ويمكن تشغيلهما على جهاز MacBook.

لماذا نطلق نسخة مفتوحة من Pangram؟

لقد حرصنا دائمًا على متابعة أحدث التطورات في مجال الكشف عن المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي، ونرغب في تمكين الباحثين الآخرين من إحراز تقدم في هذا المجال. لقد ساهمنا سابقًا في المجتمع من خلال نشر ورقة بحثية بعنوان EditLens تعرض طرقًا مبتكرة لتحليل وتصنيف المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي، وإجراء تحليلات واسعة النطاق على المراجعات النظيرة والصحف الأمريكية، وتقديم منح API للباحثين. ومن خلال إصدار نقاط التحقق لنموذج EditLens، ومجموعة بيانات التدريب، والكود المصدري، نأمل أن يتمكن الباحثون من مواصلة البناء على أساس عملنا.

تحرير العدسة والكشف بمساعدة الذكاء الاصطناعي

يجب أن يتطور الكشف عن الذكاء الاصطناعي بالتوازي مع تطور استخدام الذكاء الاصطناعي التوليدي. فقد كشفت دراسة حديثة أجرتها OpenAI أن ثلثي جميع الطلبات المتعلقة بالكتابة الموجهة إلى ChatGPT تتضمن تعديل نص مقدم من المستخدم بدلاً من إنشائه من الصفر. في ضوء هذا النموذج الناشئ الذي يجمع بين البشر والذكاء الاصطناعي في تأليف النصوص، قمنا بتطوير إطار عمل جديد للكشف يأخذ في الاعتبار مدى مساهمة الذكاء الاصطناعي في النص. ربما لاحظ مستخدمو Pangram أن نموذجنا يعرض نتائج مثل "بمساعدة طفيفة من الذكاء الاصطناعي" أو "بمساعدة معتدلة من الذكاء الاصطناعي". أصبحت هذه التصنيفات ممكنة بفضل التكنولوجيا المعروضة في ورقة بحثنا في ICLR 2026،"EditLens: Quantifying the Extent of AI Editing in Text"، التي تقدم نموذجًا للكشف عن الذكاء الاصطناعي يعطي درجة من 0 إلى 1، حيث تشير 0 إلى نص مكتوب بالكامل بواسطة البشر، بينما تشير 1 إلى نص تم إنشاؤه بالكامل بواسطة الذكاء الاصطناعي. مع إصدار مجموعة البيانات الخاصة بنا ورمز المصدر، يمكن لأي شخص الآن تدريب نموذج EditLens الخاص به.

مجموعات البيانات

نحن نطلق مجموعة بيانات EditLens التي تضم 60 ألف نموذج للتدريب، و2.4 ألف نموذج للتحقق، و6 آلاف نموذج للاختبار. ويتألف كل قسم من نصوص كُتبت بالكامل بواسطة البشر، ونصوص تم إنشاؤها بالكامل بواسطة الذكاء الاصطناعي، ونصوص تم تحريرها بواسطة الذكاء الاصطناعي، وذلك من 4 مجالات. تم إنشاء النصوص التي تم تحريرها بواسطة الذكاء الاصطناعي من خلال تطبيق موجه تحرير على نص مصدر مكتوب بواسطة البشر من أحد المجالات الخمسة التالية: الأخبار (Narayan et al., 2018 و See et al., 2017)، والكتابة الإبداعية (Fan et al., 2018)، ومراجعات Amazon (Zhang et al., 2015)، مراجعات Google (Li et al., 2022)، ومحتوى الويب المتعلق بالتعليم (Lozhkov et al., 2024).

كانت النماذج المستخدمة لإنشاء النصوص التي تم إنتاجها وتحريرها بواسطة الذكاء الاصطناعي هي نماذج OpenAI gpt-4.1-2025-04-14 ، شركة أنثروبيك كلود-سونيت-4-20250514 ، وGoogleجيميني-2.5-فلاش.

تتضمن مجموعة بيانات EditLens أيضًا قسمين للتقييم خارج المجال: 6 آلاف مثال من مجال نصي تم استبعاده (رسائل البريد الإلكتروني) ونسخة من قسم الاختبار التي أنشأتها شركة Meta Llama-3.3-70B-Instruct-Turbo .

بالإضافة إلى ذلك، ننشر مجموعة بيانات جمعناها تضم ما يقرب من 1.8 ألف نص تم تحريرها باستخدام Grammarly. تتكون هذه المجموعة من 9 تعديلات مختلفة لـ 200 نص أصلي كتبها البشر. كل تعديل من هذه التعديلات (مثل «تبسيط هذا») هو اقتراح تعديل من معالج النصوص المدمج في Grammarly. تم أخذ عينات من النصوص الأصلية المكتوبة بواسطة البشر البالغ عددها 200 نص من إحدى مجموعات البيانات التالية: Persuade 2.0 (Crossley et al., 2024)، ELLIPSE (Crossley et al., 2023)، BAWE (Nesi et al., 2004)، ICNALE (Ishikawa et al., 2007)، CLASSE (Crossley et al., 2024)، أو PIILO (Holmes et al., 2023).

يمكنك استكشاف مجموعتي البيانات هاتين على HuggingFace.

نماذج

بانجرام/إيديتلنس_لاما-3.2-3B تم ضبطه باستخدام QLoRA مع طول تسلسل أقصى يبلغ 1024 رمزًا. ويحتوي النموذج الأساسي على 3 مليارات معلمة.

بانجرام/تحرير_روبرتا-كبيرتم ضبط نموذج يحتوي على 355 مليون معلمة، باستخدام طول تسلسل أقصى يبلغ 512 رمزًا.

تم تدريب كلا النموذجين لمدة دورة واحدة وفقًا للطريقة الموضحة في ورقة EditLens البحثية. يمكن العثور على المعلمات الفائقة الإضافية ورمز التدريب لكلا النموذجين في مستودع GitHub الخاص بـ EditLens. يمكنك تنزيل نقاط فحص النموذج من HuggingFace.

التقييمات

بالنسبة للتصنيف الثنائي والثلاثي على حد سواء، نحدد القيم الحدية من خلال المعايرة على مجموعة التحقق التي تم استبعادها.

فيما يتعلق بالتقييمات الثنائية، نحدد العتبة التي تزيد من درجة F1 إلى أقصى حد لتمييز النصوص المكتوبة بالكامل بواسطة البشر عن النصوص التي تم إنشاؤها بالكامل بواسطة الذكاء الاصطناعي. ولا توجد أي نصوص تم تحريرها بواسطة الذكاء الاصطناعي في التقييمات الثنائية.

بالنسبة للتقييمات الثلاثية، نحدد عتبتين. أولاً، نقسم بيانات التقييم إلى ثلاث فئات: «بشري»، و«الذكاء الاصطناعي»، و«معدّل بواسطة الذكاء الاصطناعي». ثم نحدد عتبة دنيا تفصل فئة «البشري» عن مجموع بيانات [الذكاء الاصطناعي، المعدّل بواسطة الذكاء الاصطناعي]، وعتبة عليا تفصل فئة «الذكاء الاصطناعي» عن مجموع بيانات [البشري، المعدّل بواسطة الذكاء الاصطناعي]. ويتم تحديد كلتا العتبتين من خلال تعظيم درجة F1.

مجموعة الاختبار داخل المجال

نتائج التصنيف الثنائي

2,038 نصًا من تأليف البشر و2,046 نصًا من تأليف الذكاء الاصطناعي

جهاز الكشفماكرو F1FPRFNR
بانجرام 3.2 (الطراز الحالي قيد الإنتاج)1.0000.0000.000
Pangram OSS: editlens_Llama-3.2-3B1.0000.0000.000
Pangram OSS: editlens_roberta-large0.9970.0020.003
Fast-DetectGPT0.8950.1210.088
منظار0.8860.1280.101

نتائج التصنيف الثلاثي

2,038 نصًا من تأليف البشر، و2,046 نصًا من تأليف الذكاء الاصطناعي، و2,031 نصًا تم تحريره بواسطة الذكاء الاصطناعي

جهاز الكشفالدقةماكرو F1F1 البشريAI F1تم تحريره بواسطة الذكاء الاصطناعي - فورمولا 1
بانجرام 3.2 (الطراز الحالي قيد الإنتاج)0.9200.9200.9260.9570.876
Pangram OSS: editlens_Llama-3.2-3B0.8950.8950.8950.9480.842
Pangram OSS: editlens_roberta-large0.8810.8810.9000.9230.819
Fast-DetectGPT0.5850.5450.2460.8310.558
منظار0.5690.5230.2130.8110.545

المجال المستبعد (رسائل البريد الإلكتروني الخاصة بشركة إنرون)

نتائج التصنيف الثنائي

1,992 نصًا بشريًا و1,847 نصًا من إنتاج الذكاء الاصطناعي

جهاز الكشفماكرو F1FPRFNR
بانجرام 3.2 (الطراز الحالي قيد الإنتاج)0.9990.0010.001
Pangram OSS: editlens_Llama-3.2-3B0.9980.0010.004
Pangram OSS: editlens_roberta-large0.9660.0010.068
Fast-DetectGPT0.9410.0790.036
منظار0.9140.1550.011

نتائج التصنيف الثلاثي

1,992 نصًا من تأليف البشر، و1,847 نصًا من تأليف الذكاء الاصطناعي، و2,308 نصًا تم تحريره بواسطة الذكاء الاصطناعي

جهاز الكشفالدقةماكرو F1F1 البشريAI F1تم تحريره بواسطة الذكاء الاصطناعي - فورمولا 1
بانجرام 3.2 (الطراز الحالي قيد الإنتاج)0.9050.9090.8980.9560.872
Pangram OSS: editlens_Llama-3.2-3B0.8630.8680.8550.9360.812
Pangram OSS: editlens_roberta-large0.6950.6730.8470.5150.657
Fast-DetectGPT0.6250.5890.2610.8860.619
منظار0.6180.5750.2660.8570.601

نموذج تم تطويره (Llama 3.3 70B Instruct)

نتائج التصنيف الثنائي

2,038 نصًا من تأليف البشر و2,038 نصًا من تأليف الذكاء الاصطناعي

جهاز الكشفماكرو F1FPRFNR
بانجرام 3.2 (الطراز الحالي قيد الإنتاج)1.0000.0000.000
Pangram OSS: editlens_Llama-3.2-3B1.0000.0000.000
Pangram OSS: editlens_roberta-large0.9870.0020.025
Fast-DetectGPT0.9390.1210.000
منظار0.9360.1280.000

نتائج التصنيف الثلاثي

2,038 نصًا من تأليف البشر، و2,038 نصًا من تأليف الذكاء الاصطناعي، و1,881 نصًا تم تحريره بواسطة الذكاء الاصطناعي

جهاز الكشفالدقةماكرو F1F1 البشريAI F1تم تحريره بواسطة الذكاء الاصطناعي - فورمولا 1
بانجرام 3.2 (الطراز الحالي قيد الإنتاج)0.9520.9510.9460.9850.923
Pangram OSS: editlens_Llama-3.2-3B0.9210.9200.9180.9650.877
Pangram OSS: editlens_roberta-large0.8600.8590.9080.8790.791
Fast-DetectGPT0.5620.5060.2620.8170.440
منظار0.5400.4780.2270.7960.411

اختبارات الأداء من جهات خارجية

اللغة الإنجليزية كلغة ثانية (ليانغ وآخرون، 2023)

91 نصًا بشريًا

جهاز الكشفFPR
بانجرام 3.2 (الطراز الحالي قيد الإنتاج)0.000
Pangram OSS: editlens_Llama-3.2-3B0.055
Pangram OSS: editlens_roberta-large0.099
منظار0.560
Fast-DetectGPT0.670

أجهزة الكشف عن البشر (راسل وآخرون، 2024)

150 نصًا من تأليف البشر و150 نصًا من تأليف الذكاء الاصطناعي

جهاز الكشفماكرو F1FPRFNR
بانجرام 3.2 (الطراز الحالي قيد الإنتاج)1.0000.0000.000
Pangram OSS: editlens_Llama-3.2-3B0.9870.0270.000
Pangram OSS: editlens_roberta-large0.9600.0200.060
منظار0.8460.0870.220
Fast-DetectGPT0.7350.4870.013

RAID، عينة عشوائية مكونة من 10 آلاف (Dugan et al., 2024)

2,058 نصًا من تأليف البشر و7,942 نصًا من تأليف الذكاء الاصطناعي

كاشفماكرو F1FPRFNR
بانجرام 3.2 (الطراز الحالي قيد الإنتاج)0.9920.0020.007
Fast-DetectGPT0.9410.0780.028
منظار0.9390.1000.024
Pangram OSS: editlens_Llama-3.2-3B0.9300.0030.062
Pangram OSS: editlens_roberta-large0.7360.0070.288

مجموعة بيانات Grammarly

في هذه الرسوم البيانية الصندوقية، نعرض توزيع الدرجات على مجموعة بيانات Grammarly التي جمعناها، مجمعة حسب التعديل المطبق. ونلاحظ أن EditLens تمنح درجات منخفضة جدًا، تقارب الدرجات التي يمنحها البشر، لتعديلات مثل "تصحيح أي أخطاء"، والتي تتعلق بتصحيحات بسيطة في القواعد النحوية والإملائية، في حين تُمنح التعديلات "الإضافية" مثل "اجعلها أكثر تفصيلاً" درجات أعلى.

توزيع الدرجات حسب تعليمات التحرير في Pangram OSS: editlens_Llama-3.2-3B

توزيع الدرجات حسب تعليمات التحرير في Pangram OSS: editlens_roberta-large

في أي مجال ينبغي استخدام Open Pangram؟

نشجع الباحثين على استخدام نماذج «Open Pangram» كأساس مرجعي في أبحاثهم المتعلقة بالكشف عن الذكاء الاصطناعي. ونأمل أن تمكّن مجموعات البيانات وشفرة المصدر الباحثين من تطوير عملنا.

في أي الحالات لا ينبغي استخدام "Open Pangram"؟

لا يُسمح بالاستخدام التجاري لـ Open Pangram. يجب عدم استخدام نماذج Open Pangram لفرض أي نوع من سياسات استخدام الذكاء الاصطناعي في البيئات التعليمية أو المهنية. للحصول على نموذج أكثر دقة يتميز بمعدل إيجابيات خاطئة هو الأفضل في القطاع، يرجى الاتصال بنا للاطلاع على عروضنا المخصصة للمؤسسات أو للحصول على منح واجهة برمجة التطبيقات (API) للأغراض البحثية.

اشترك في نشرتنا الإخبارية
نشارك تحديثات شهرية حول أبحاثنا في مجال الكشف عن الذكاء الاصطناعي.