الإعلان عن شراكة جديدة مع Proofig! تعرف على المزيد
الصورة من تصوير فالنتين أنتونوتشي.
يسعدنا أن نعلن عن تحديث هام لـ Pangram Text، نموذجنا الرائد في مجال الكشف عن الذكاء الاصطناعي. أصبح بإمكان Pangram Text الآن الكشف عن النصوص التي تم إنشاؤها بواسطة الذكاء الاصطناعي باللغات الإسبانية والفرنسية والإيطالية والبرتغالية والألمانية والروسية والصينية الماندرينية، بنفس الدقة الرائدة في المجال التي يتمتع بها النص المكتوب باللغة الإنجليزية. نحن بصدد طرح نموذجنا الجديد متعدد اللغات لحماية المنصات الإلكترونية من الرسائل غير المرغوب فيها التي يتم إنشاؤها بواسطة الذكاء الاصطناعي على الفور.
من أجل اختبار دقة نموذجنا على اللغات غير الإنجليزية، نستخدم 3 مجموعات كبيرة ومتنوعة من النصوص متعددة اللغات من مجالات مختلفة: مراجعات أمازون متعددة اللغات، ويكيبيديا، و XLSum (بي بي سي نيوز إنترناشونال).
بالنسبة للجانب البشري من المعيار، نقوم بأخذ عينات عشوائية من المستندات التي تجتاز مرشحات فحص الصحة لدينا. بالنسبة للجانب الخاص بالذكاء الاصطناعي من المعيار، نستخدم مزيجًا من GPT-3.5 و GPT-4 و GPT-4o. أولاً، نطلب من LLM تلخيص المستند الحقيقي، على سبيل المثال، "ما موضوع هذه المراجعة؟" ثم نطلب منه إنشاء مراجعة أو مقال أو خبر إخباري بناءً على الملخص. إن إنشاء المعيار بهذه الطريقة يزيل احتمال وجود ضوضاء في التسميات، كما يضمن أن تكون توزيعات البيانات البشرية والبيانات الخاصة بالذكاء الاصطناعي متشابهة قدر الإمكان.
| اللغة | دقة تقييمات أمازون | دقة ويكيبيديا | XLSum (بي بي سي نيوز) الدقة |
|---|---|---|---|
| الإسبانية | 99.59% | 99.75% | 99.75% |
| الفرنسية | 98.84% | 99.33% | 98.50% |
| إيطالي | غير متوفر | 99.82% | غير متوفر |
| الألمانية | 99.44% | 99.95% | غير متوفر |
| البرتغالية | غير متوفر | 99.83% | 99.70% |
| روسي | غير متوفر | 98.34% | 99.35% |
| الصينية | 99.70% | 99.54% | 98.10% |
نظرًا لأن نموذجنا يعتمد على بنية مشابهة لنماذج اللغات الحديثة الكبيرة، فإننا نستخدم تدريبًا مسبقًا واسع النطاق لضمان تدريب العمود الفقري لدينا على مجموعة كبيرة متعددة اللغات قبل ضبط رأس الكشف بالذكاء الاصطناعي. كما نستخدم أداة ترميز تدعم العديد من اللغات، بما في ذلك الروسية والصينية.
اخترنا اللغات التي تمثل غالبية اللغات المستخدمة على الإنترنت.
نستخدم Amazon Comprehend لاكتشاف لغة النص المدخل. إذا كانت اللغة غير مدعومة، فسنعرض "لغة غير مدعومة" كتنبؤ.
نعم، نتوقع إصدار تحديثات مستقبلية مع تحسين الأداء على اللغات غير الإنجليزية، حيث نواصل توسيع قاعدة بياناتنا متعددة اللغات من خلال التعلم النشط.
نخطط لدعم المزيد من اللغات في المستقبل. إذا كانت هناك لغة تود أن يتم دعمها، فيرجى إخبارنا بذلك!
اتصل بنا على info@pangram.com للحصول على مزيد من المعلومات حول الكشف عن الذكاء الاصطناعي متعدد اللغات.
