الإعلان عن شراكة جديدة مع Proofig! تعرف على المزيد
يستخدم مصنفنا بنية نموذج لغوي تقليدي. يتلقى النص المدخل ويقوم بتقسيمه إلى وحدات لغوية. ثم يحول النموذج كل وحدة لغوية إلى تضمين، وهو متجه من الأرقام يمثل معنى كل وحدة لغوية.
يتم تمرير المدخلات عبر الشبكة العصبية، مما ينتج عنه تضمين المخرجات. يقوم رأس المصنف بتحويل تضمين المخرجات إلى تنبؤ 0 أو 1، حيث 0 هي التسمية البشرية و1 هي التسمية الخاصة بالذكاء الاصطناعي.
كان النموذج الأولي فعالاً بالفعل، لكننا أردنا تعظيم الدقة وتقليل أي احتمال لحدوث نتائج إيجابية خاطئة (التنبؤ بشكل خاطئ بأن المستندات التي كتبها البشر هي مستندات أنشأتها الذكاء الاصطناعي). وللقيام بذلك، قمنا بتطوير خوارزمية خاصة بنماذج الكشف عن الذكاء الاصطناعي.
مع مجموعة البيانات الأولية، لم يكن لدى نموذجنا ما يكفي من الإشارات للانتقال من دقة 99٪ إلى دقة 99.999٪. في حين أن النموذج يتعلم الأنماط الأولية في البيانات بسرعة، إلا أنه يحتاج إلى رؤية حالات صعبة من أجل التمييز بدقة بين النصوص البشرية ونصوص الذكاء الاصطناعي.
نحل هذه المشكلة باستخدام النموذج للبحث في مجموعات البيانات الكبيرة عن النتائج الإيجابية الخاطئة وتعزيز مجموعة التدريب الأولية بهذه الأمثلة الصعبة الإضافية قبل إعادة التدريب. بعد عدة دورات من هذا، يُظهر النموذج الناتج معدل نتائج إيجابية خاطئة يقارب الصفر بالإضافة إلى تحسن الأداء العام في مجموعات التقييم المحتجزة.
