الأخبار

نظرية المعلومات التي تفسر سبب رداءة الكتابة التي تنتجها الذكاء الاصطناعي

جو ستيتش

19 مايو 2026

جدول المحتويات

الصوت باعتباره توزيعًا احتماليًا
مصيدة RLHF و"لهجة إجماع المُعلِّق"
وهم التمويه (لماذا تفشل المطالبة بتحديد النمط)
فشل "تيمبيراتور" وأصدقاؤه
وماذا في ذلك؟

إفصاح: تم استخدام نموذج لغوي يعمل بالذكاء الاصطناعي خلال عملية التحرير لكتابة مسودات الأوصاف الفنية واقتراح تحسينات على البنية والأسلوب. وقد أُدرجت عدة اقتراحات من الذكاء الاصطناعي في النسخة النهائية من المقالة.

لقد قرأت كمية هائلة من الأدب الخيالي، ولا سيما الخيال العلمي. كما أنني أستخدم كل نموذج رائد من نماذج الذكاء الاصطناعي التي يتم إصدارها في إطار عملي في هندسة البرمجيات.

تركت هاتان التجربتان لديّ شعوراً مزعجاً بأن الذكاء الاصطناعي يتمتع بـ«صوت» متجانس بشكل مذهل مقارنةً بمؤلف بشري متميز.

كل من يحب الأدب قد شعر بما أعنيه. لقد قرأت قصصًا لحوالي خمسة آلاف كاتب مختلف، لكنني أعتقد بصدق أنه حتى لو كنت قد قرأت لستة كتاب فقط، فستلاحظ أن لكل كاتب أسلوبه الخاص به.

بالمقارنة مع الأصوات الفريدة للكتاب البشريين، تبدو نصوص الذكاء الاصطناعي متشابهة بشكل لافت للنظر. وتبين أن هناك سببًا وجيهًا وراء ذلك، وهو يتعلق بنظرية المعلومات.

الصوت باعتباره توزيعًا احتماليًا

«الصوت» الفريد للمؤلف ليس عشوائياً، ولا هو عادي. إنه توزيع احتمالي محدد — دعونا نسميه P_author. عندما يكتب المؤلف، فإنه يستقي عينات من عملية تتميز بدرجة عالية من الخصوصية. فهناك احتمالات شرطية محددة لكيفية تطبيقه للمفاهيم، وتوزيع الإيقاع، والمفردات، والأدوات الأسلوبية الأخرى.

ما يجعل الصوت مميزًا هو الخيارات ذات التردد المنخفض والتأثير الكبير التي يتخذها المؤلف باستمرار (الجزء الطويل من التوزيع). إذا قلت «تيد تشيانغ»، فسوف تفكر على الفور في مدى بساطة جمله من الناحية النحوية وكثافتها من الناحية الدلالية (إنه أسلوب أحترمه، لكن كما توضح هذه الجملة الواردة بين قوسين، لا أستطيع محاكاته). إذا قلت "أورسولا ك. لي غوين"، فستفكر في مدى وضوحها وتوازنها مع قدرتها على إضفاء طابع شاعري — لا أستطيع وصف أسلوبها جيدًا، لكن قراء لي غوين يعرفون ما أعنيه.

في النهاية، ما أريد الوصول إليه هو أن الطريقة الصحيحة لقياس مدى "شبه النص بالذكاء الاصطناعي" لا تكمن في التحقق مما إذا كان النص قابلاً للتنبؤ بشكل عام — فمعظم النصوص الجيدة تكون قابلة للتنبؤ إلى حد ما — بل في قياس انحراف KL بين توزيع مخرجات النموذج وتوزيع مؤلف معين: D_KL(P_author || Q_model). بالنسبة لأولئك الذين ليسوا على دراية بتباين KL، فإن هذا يقيس مدى فشل توزيع النموذج في تغطية اختيارات المؤلف (على وجه التحديد، يقيس التكلفة الإضافية المتوقعة للمعلومات لترميز العينات من P باستخدام رمز مُحسّن لـ Q). عندما يكون هذا التباين كبيرًا ومنظمًا، تسمع صوتًا.

مصيدة RLHF و"لهجة إجماع المُعلِّق"

خلال مرحلة ما قبل التدريب، يقوم نموذج لغوي ضخم بإنشاء خريطة للتوزيع العام للنصوص البشرية. هذا التوزيع الأساسي، Q_base، واسع للغاية. ويحتوي في فضاءه الكامن على القدرة على تقريب أي P_author تقريبًا.

الفخ الذي أشير إليه يبدأ بمسألة التوافق. ولجعل النموذج آمنًا ومفيدًا، تطبق المختبرات تقنيات مثل «التعلم المعزز من ردود فعل البشر» (RLHF) وغيرها. وتختلف التفاصيل، لكن خلاصة القول هي أن النموذج يتم تحسينه لإنتاج مخرجات تحصل على درجات جيدة مقابل إشارة مكافأة مستمدة من تفضيلات البشر (أو الذكاء الاصطناعي).

وهذا لا يدفع النموذج نحو المتوسط الإحصائي للغة الإنجليزية. بل يدفعه نحو شيء له توزيع احتمالي مختلف — دعونا نسمي هذا «لهجة إجماع المُعلِّمين».

والآلية التي تؤدي إلى ذلك هي التالية: عندما يقوم القضاة (سواء كانوا عمالاً مستقلين تم توظيفهم لتقييم النتائج، أو خبراء، أو أي جهة أخرى) بتقييم النتائج، فإن أسلوب الكتابة الفريد من نوعه يؤدي إلى تباين كبير في التقييمات. قد يحصل أسلوبي في الكتابة على 5/5 من أحد المقيمين و2/5 من آخر. لكن الرد الجاف والمتناسق والمتحفظ للغاية قد يحصل على 4/5 من الجميع. تنص خوارزمية التحسين على أن الطريقة الأكثر أمانًا لتعظيم المكافأة المتوقعة هي تقليص التباين. إنه المكافئ الحواري لديكور ردهة الفندق.

قد تقول: «جو، هذا وصف غير عادل! فالتقنيات الحديثة للمواءمة مصممة صراحةً للحفاظ على التنوع!». ورغم صحة ذلك، فإن الأساليب الحديثة لا تزال تهدف إلى تحسين النتيجة «المفضلة»، وهو ما لا يزال يعاقب على المجازفة التي تنطوي على تباين كبير مقارنةً بالنصوص الآمنة والمقبولة على نطاق واسع.

هذه فرضية قابلة للاختبار (لم أختبرها بنفسي، لكنها قابلة للاختبار). إذا قمت بقياس انحراف كليمنس-لي (KL) بين مخرجات النموذج المُحاذاة ومجموعة نصوص، على سبيل المثال، من "الاتصالات المؤسسية" مقابل "الأدب الخيالي"، فإن توقعي هو أن توزيع النموذج سيكون أقرب بكثير إلى "المركز المؤسسي". على حد علمي، لم ينشر أحد هذا القياس بالضبط، لكن حسابات التحسين تتنبأ بذلك بقوة.

وهم التمويه (لماذا تفشل المطالبة بتحديد النمط)

أعرف ما يدور في ذهنك: نعم، لكن يمكنك توجيه النموذج للخروج عن هذه اللهجة. "اكتب بأسلوب روايات البوليس الصارمة في عشرينيات القرن الماضي" أو أي شيء آخر (جزء مني يرغب في معرفة كيف سيبدو هذا المقال لو طلبت من النموذج إعادة كتابته على غرار كلمات أغاني لوب فياسكو). وهذا ينتج بالفعل نصًا يبدو مختلفًا عن "لهجة إجماع المُعلِّق"، لكنه لا يزال يبدو متجانسًا بشكل مثير للريبة.

وذلك لأن هناك فرقًا رياضيًا بين إزاحة متوسط التوزيع وإعادة إنتاج بنية التباين فيه.

عندما تطلب من نموذج ما أن يقلد كاتبًا ما، فإنه يغير مركز ثقله. فهو يحسب المتوسط الإحصائي لمفردات الكاتب المستهدف، وبنية جمله، وغيرها من السمات الأسلوبية، ثم يتحرك نحو ذلك. لكنه يطبق على هذا الموقع الجديد نفس آليات «تقليص التباين» التي كنا نتحدث عنها.

يعتمد الأسلوب البشري على «الاختلال المنظم». فلكاتب ما إيقاع أساسي، لكنه يكسره عن قصد من خلال أمور مثل الانتقال المفاجئ إلى جملة مجزأة، أو استخدام فعل غير معتاد، أو تشابك الجملة لتحقيق تأثير عاطفي. وتمتلك علم قياس الأسلوب الحاسوبي أدوات لقياس ذلك: فمعاملات هيرست (Hurst exponents) على السلاسل الزمنية لطول الجمل يمكن أن تكشف عن تبعيات بعيدة المدى في الكتابة البشرية تفتقر إليها النصوص التي تنتجها الذكاء الاصطناعي. ويقوم المؤلفون البشريون بتنظيم تنوعهم المعجمي بطرق لا تفعلها النماذج.

ما أعنيه من هذا هو أنه عندما تطلب الكتابة بأسلوب معين، فإن النموذج يستوعب سمات الأسلوب المستهدف، لكنه يخفف من حدة التقلبات. إنه ينتج صورة كاريكاتورية لما طلبته.

فشل "تيمبيراتور" وأصدقاؤه

إذا كان نطاق توزيع الذكاء الاصطناعي ضيقًا للغاية، فلماذا لا نوسعه ببساطة؟

النهج الأكثر شيوعًا هو "تحجيم درجة الحرارة". فعندما ترفع درجة الحرارة T، تقوم بقسمة قيم اللوجيت الأولية للنموذج على T قبل حساب الاحتمالات، مما يؤدي إلى تسطيح التوزيع بأكمله ويجبر النموذج على اختيار كلمات أقل احتمالية. لكنه يقوم بذلك بشكل عشوائي. فغرابة أسلوب الكاتب البشري ترتبط بظروف محددة للغاية. فالبشر يخرقون القواعد بطرق محددة ومتسقة للغاية، في حين أن "تحجيم درجة الحرارة" لا يؤدي سوى إلى إدخال ضوضاء عشوائية.

آمل أن يكون هذا واضحًا بشكل بديهي — ففي النهاية، تؤدي زيادة درجة الحرارة إلى الانتقال من حالة "السلاسة المشبوهة" إلى حالة "العشوائية المشبوهة" دون المرور بحالة "البشرية" على الإطلاق.

أعلم أن هناك استراتيجيات فك تشفير أكثر تطوراً. فكل من أخذ العينات من أعلى p (النواة)، والتصفية من أعلى k، وعقوبات التكرار، والتوجيه بدون مصنف، كلها تحاول تحقيق إعادة توزيع أكثر استهدافاً. وهي تساعد بالفعل في بعض الجوانب، لكن لا تحل أي منها المشكلة الأساسية المتمثلة في أن هذه تدخلات تتم في وقت الاستدلال وتعمل على نموذج تشكلت فلسفته التشغيلية الكاملة (إن جاز التعبير) خلال مرحلة المواءمة.

وهناك أيضًا فارق دقيق مهم هنا أشار إليه أحد أصدقائي مؤخرًا: فالتوافق لا يمحو القدرة الكامنة للنموذج الأساسي على التباين الأسلوبي. فالأوزان المُدرَّبة مسبقًا لا تزال تحمل معظم ثراء Q_base، طالما كان لديك ما يكفي من الأوزان. هناك تقنيات توجيهية ناشئة في وقت الاستدلال مثل هندسة التمثيل (Representation Engineering) التي يمكنها استعادة التباين المكبوت جزئيًا من خلال الوصول إلى الفضاء الكامن الأساسي. لكن هذه مجالات بحثية وليست متوفرة في منتجات الذكاء الاصطناعي العامة.

وبالمثل، يمكن أن يُحقق التعلم في سياق طويل نتائج أفضل قليلاً، لكن آليات الانتباه تضعف عندما يصبح السياق كبيراً بما يكفي (وستبدأ في العودة تدريجياً إلى التوزيع المتساوي مع تزايد حجم السياق).

وماذا في ذلك؟

النقطة الأساسية هنا هي أن خيارات التصميم التي تُستخدم في التقنيات المرتبطة بتقنية RLHF ستجعل هذه «الأصوات» التي تولدها الذكاء الاصطناعي قابلة للكشف لفترة أطول بكثير مما يرغب أي شخص في الاعتراف به.

كما أنه من المفيد التفكير في أسلوب الكاتب باعتباره توزيعًا احتماليًا محددًا عالي الأبعاد، وأدعوكم إلى محاولة تحديد بعض انحراف KL بأنفسكم في المرة القادمة التي تقرؤون فيها لأحد مؤلفيكم المفضلين. من أين تأتي صوت الكاتب؟ إنه تمرين ممتع قد يزيد من استمتاعكم بالنص، كما أن عملية التدريب الصعبة واستيعاب المعرفة الجديدة هي عملية جيدة يمكن القيام بها في هذه الأيام التي تشهد ضمورًا في المهارات بسبب نموذجات اللغة الكبيرة (LLM).

جو ستيتش

جو ستيشكاتب ضيف

جو ستيش هو محرر سلسلة المختارات السنوية «Think Weirder: The Year's Best Science Fiction Ideas». كما يعمل كمهندس حلول رئيسي في قسم تمكين المطورين والمنصات بشركة «Arm». الآراء الواردة هنا تعبر عن وجهة نظره الشخصية.

المزيد من جو ستيتش

مقالات ذات صلة

Pangram Space: مشروع بحثي تفاعلي

Pangram Space: مشروع بحثي تفاعلي

نقدم لكم «Pangram Space»، وهو مستكشف تفاعلي للتضمينات الخاصة بالتنشيطات الداخلية في «Pangram 3.3.2».

إلياس مسرور18 يونيو 2026

المسوقون يهدرون ميزانياتهم الإعلانية على المحتوى الذي يُنتج بواسطة الذكاء الاصطناعي

المسوقون يهدرون ميزانياتهم الإعلانية على المحتوى الذي يُنتج بواسطة الذكاء الاصطناعي

مع تزايد تطور نماذج اللغة الكبيرة (LLMs)، سيدرك المحتالون ومرسلو الرسائل غير المرغوب فيها الفرصة المتاحة لاستخدام الذكاء الاصطناعي التوليدي لنشر محتوى مزيف على نطاق واسع عبر شبكة الإنترنت بهدف الاستيلاء على عائدات الإعلانات.

آشان مارلا24 يونيو 2024

تقديم "أوبن بانغرام"

تقديم "أوبن بانغرام"

نعلن عن إصدار نسخ مفتوحة من حيث الأوزان وشفرة المصدر من Pangram، والتي تستند إلى تقنية EditLens التي قدمناها في ورقتنا البحثية المقدمة في مؤتمر ICLR 2026.

كاثرين تاي24 مارس 2026

تتعاون Pangram مع Proofig AI لتزويد PubShield بخدمة الكشف عن النصوص المكتوبة بواسطة الذكاء الاصطناعي

تتعاون Pangram مع Proofig AI لتزويد PubShield بخدمة الكشف عن النصوص المكتوبة بواسطة الذكاء الاصطناعي

أبرمت شركتا Pangram وProofig AI شراكة لتوفير أدوات أفضل تضمن النزاهة والشفافية للباحثين والمؤسسات والمنشورات.

ماكس سبيرو19 فبراير 2026

تتعاون شركتا «تريمو» و«بانجرام لابز» للتعامل مع المحتوى الذي تولده الذكاء الاصطناعي

تتعاون شركتا «تريمو» و«بانجرام لابز» للتعامل مع المحتوى الذي تولده الذكاء الاصطناعي

مع اقترابنا من أهم عام انتخابي في التاريخ، يعود التقاء التكنولوجيا والديمقراطية ليحتل مركز الصدارة مرة أخرى.

ماكس سبيرو وتريماو17 أبريل 2024

أحدث الأبحاث في مجال الكشف باستخدام الذكاء الاصطناعي

أحدث الأبحاث في مجال الكشف باستخدام الذكاء الاصطناعي

أصبحت عبارة "بانغرام" تظهر بشكل متكرر في الأبحاث المنشورة في مجال الكشف عن الذكاء الاصطناعي.

إلياس مسرور4 مارس 2025

اشترك في
لتلقي آخر أخبارنا

ابق على اطلاع بأحدث أخبارنا وعروضنا.

المنتجات

كاشف الذكاء الاصطناعي ملحق المتصفح واجهة برمجة التطبيقات تكامل مع أنظمة إدارة التعلم (LMS)أداة فحص الانتحال الكشف عن الانتحال باستخدام الذكاء الاصطناعي متعدد اللغات

للمنظمات

للمعلمين للنشر والإعلام لإدارة المحتوى للمطورين للمكاتب القانونية للجامعات للموظفين لمهندسي التعلم الآلي للمتوافقين

البحوث

كيفية عمل نظام الكشف عن الذكاء الاصطناعي أوراق بحثية من Pangram استفسارات بحثية أبرز الأخبار النماذج الأحداث المراجعات

الموارد

التعليم في مجال الذكاء الاصطناعي تحديثات المنتجات الأخبار دراسات الحالة المدونة الأسعار شروط الخدمة سياسة الخصوصية الأسئلة الشائعة حول خصوصية البيانات الحالة

الشركة

عننا اتصل بنا الوظائف الصحافة

soc2

SOC2 النوع 2

تم التحقق من قبل AssuranceLab

© 2025 Pangram. جميع الحقوق محفوظة.

info@pangram.com

انضم إلى مجتمعنا

© 2025 Pangram. جميع الحقوق محفوظة.

نظرية المعلومات التي تفسر سبب سوء جودة الكتابة التي تنتجها الذكاء الاصطناعي | Pangram Labs