كيف يكتشف "بانغرام" المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي

عرض التقرير الفني بصيغة PDF

نظرة عامة

تم تصميم Pangram Text لاكتشاف المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي بمعدل إيجابي خاطئ يقارب الصفر. يقلل نهجنا التدريبي الصارم من الأخطاء ويسمح للنموذج باكتشاف النصوص التي تم إنشاؤها بواسطة الذكاء الاصطناعي من خلال تحليل وفهم الإشارات الدقيقة في الكتابة.

عملية التدريب الأولي

يستخدم مصنفنا بنية نموذج لغوي تقليدية. فهو يستقبل النص المدخل ويقسمه إلى رموز. ثم يحول النموذج كل رمز إلى «تضمين»، وهو متجه من الأرقام يمثل معنى كل رمز.

يتم تمرير المدخلات عبر الشبكة العصبية، مما ينتج عنه تضمين للمخرجات. ثم يقوم رأس المصنف بتحويل تضمين المخرجات إلى تنبؤ بقيمة 0 أو 1، حيث تمثل القيمة 0 التصنيف البشري، بينما تمثل القيمة 1 تصنيف الذكاء الاصطناعي.

نقوم بتدريب نموذج أولي على مجموعة بيانات صغيرة ولكنها متنوعة تضم حوالي مليون وثيقة تتألف من نصوص عامة ومرخصة كتبها بشر. تتضمن مجموعة البيانات أيضًا نصوصًا أنتجتها الذكاء الاصطناعي بواسطة GPT-4 ونماذج لغوية رائدة أخرى. نتج عن التدريب شبكة عصبية قادرة على التنبؤ بشكل موثوق بما إذا كان النص من تأليف بشر أم ذكاء اصطناعي.

التحسين المستمر من خلال التكرار

التعدين السلبي الصعب

كان النموذج الأولي فعالاً بالفعل، لكننا أردنا تعزيز الدقة إلى أقصى حد وتقليل أي احتمال لحدوث نتائج إيجابية خاطئة (أي التنبؤ الخاطئ بأن المستندات التي كتبها البشر هي من إنتاج الذكاء الاصطناعي). ولتحقيق ذلك، قمنا بتطوير خوارزمية مصممة خصيصاً لنماذج الكشف عن الذكاء الاصطناعي.

مع مجموعة البيانات الأولية، لم يكن لدى نموذجنا ما يكفي من المؤشرات للانتقال من دقة تبلغ 99% إلى دقة تبلغ 99.999%. ورغم أن النموذج يتعلم الأنماط الأولية في البيانات بسرعة، إلا أنه يحتاج إلى التعرض لحالات حدية صعبة حتى يتمكن من التمييز بدقة بين النصوص البشرية والنصوص التي يكتبها الذكاء الاصطناعي.

ونحن نحل هذه المشكلة باستخدام النموذج للبحث في مجموعات البيانات الضخمة عن حالات الإيجابية الكاذبة، ثم نُثري مجموعة التدريب الأولية بهذه الأمثلة الصعبة الإضافية قبل إعادة التدريب. وبعد عدة دورات من هذه العملية، يُظهر النموذج الناتج معدل إيجابية كاذبة يقترب من الصفر، فضلاً عن تحسن الأداء العام على مجموعات التقييم التي تم استبعادها.

While the initial facade is unassuming, the colorful vibe and illuminated decor instantly transport you to a very hip Ethiopian eatery all the while keeping it quintessentially Crown Heights. As a vegetarian I was very excited about what this plant based kitchen had to offer and with the help of the very knowledgeable and friendly staff, my friend and I got the Lentil and Squash sambusas for our apps. These filled sweet-savory puff pastries were delectable! For our mains we went with the Mercato and Paisa platters which were good portion sizes for sure and essentially served as a tasting menu of the flavors offered at this restaurant. While I have definitely had better and fresher Ethiopian food, the ambiance drinks and attentive staff make this a very good Ethiopian spot to try! Definitely recommend!

Ras Plant Based is an absolute gem! The moment you walk in, you're greeted with warm, inviting vibes and a cozy atmosphere. The menu is a creative celebration of Ethiopian flavors, all completely plant-based and incredibly delicious. Every dish is bursting with rich, authentic spices and fresh ingredients that make each bite a culinary adventure. The injera is soft and tangy, perfect for soaking up the vibrant stews and lentils. The service is top-notch—friendly, attentive, and knowledgeable about the menu. Whether you're a vegan, vegetarian, or just someone who loves great food, Ras Plant Based offers an unforgettable dining experience. It's not just a meal; it's a cultural journey that leaves you craving more. I can't recommend it enough! Five stars all the way!

Write a 5-star review for Ras Plant Based. Make the review 135 words long.

مطالبات المرآة

نصمم الجانب المتعلق بالذكاء الاصطناعي من مجموعة البيانات بحيث يشبه إلى حد كبير الجانب البشري من حيث الأسلوب والنبرة والمحتوى الدلالي. لكل مثال بشري، ننشئ مثالاً من إنتاج الذكاء الاصطناعي يطابق الوثيقة الأصلية في أكبر عدد ممكن من المحاور، لضمان أن يتعلم نموذجنا تصنيف الوثائق بناءً على الخصائص المحددة لكتابة LLM فقط.

إعادة التدريب

نقوم بتدريب النموذج باستخدام مجموعة تدريب محدثة ونقيّم أداء النموذج في كل خطوة. باستخدام هذه الطريقة، يمكننا تقليل الأخطاء وزيادة دقة نموذجنا إلى ما هو أبعد من ما يمكن تحقيقه بالتدريب العادي.

مخطط نموذج إعادة التدريب

اعرف المزيد

تقرير تقني حول مصنف النصوص الذي أنشأته الذكاء الاصطناعي "بانجرام"

تحقق من ورقتنا الفنية الكاملة على arXiv حيث نتعمق في تفاصيل التدريب والأداء والتجارب الأخرى!

اشترك في
لتلقي آخر أخبارنا

ابق على اطلاع بأحدث أخبارنا وعروضنا.

المنتجات

كاشف الذكاء الاصطناعي ملحق المتصفح واجهة برمجة التطبيقات تكامل مع أنظمة إدارة التعلم (LMS)أداة فحص الانتحال الكشف عن الانتحال باستخدام الذكاء الاصطناعي متعدد اللغات

للمنظمات

للمعلمين للنشر والإعلام لإدارة المحتوى للمطورين للمكاتب القانونية للجامعات للموظفين لمهندسي التعلم الآلي للمتوافقين

البحوث

كيفية عمل نظام الكشف عن الذكاء الاصطناعي أوراق بحثية من Pangram استفسارات بحثية أبرز الأخبار النماذج الأحداث المراجعات

الموارد

التعليم في مجال الذكاء الاصطناعي تحديثات المنتجات الأخبار دراسات الحالة المدونة الأسعار شروط الخدمة سياسة الخصوصية الأسئلة الشائعة حول خصوصية البيانات الحالة

الشركة

عننا اتصل بنا الوظائف الصحافة

soc2

SOC2 النوع 2

تم التحقق من قبل AssuranceLab

© 2025 Pangram. جميع الحقوق محفوظة.

info@pangram.com

انضم إلى مجتمعنا

© 2025 Pangram. جميع الحقوق محفوظة.

كيف يعمل الكشف عن الذكاء الاصطناعي | Pangram Labs