الإعلان عن شراكة جديدة مع Proofig! تعرف على المزيد

تسليط الضوء على الموظفين: تعرفوا على كاثرين، عالمة أبحاث في مجال الذكاء الاصطناعي

برادلي إيمي
8 ديسمبر 2025

تسليط الضوء على الموظفين: كاثرين تاي

مرحبًا بكم في حلقتنا الثانية من سلسلة "تسليط الضوء على الموظفين"! التقينا مع كاثرين تاي، عالمة أبحاث الذكاء الاصطناعي المؤسسة لدينا، لمناقشة مسيرتها الفريدة في مجال معالجة اللغات الطبيعية (NLP)، وأبحاثها في مجال التحليل الأدبي، وما تقوم ببنائه في Pangram Labs. (ملاحظة: تمت كتابة هذه المقابلة وتحريرها قليلاً من أجل سهولة القراءة بواسطة الذكاء الاصطناعي).


من الرياضيات واللغة الإنجليزية إلى أبحاث البرمجة اللغوية العصبية

كيف أصبحت مهتمًا ببرمجة اللغة العصبية (NLP) وقررت الحصول على درجة الدكتوراه؟

في البداية، لم أكن مهتمًا بشكل مباشر ببرمجة اللغة العصبية (NLP). درست الرياضيات وعلوم الكمبيوتر واللغة الإنجليزية في المرحلة الجامعية، وشاركت في العديد من برامج البحث الجامعية لأنني أحببت فكرة البحث والتجريب، لكنني لم أكن أعرف بالضبط ما أريد دراسته.

عندما اقتربت سنتي الأخيرة في الجامعة، اقترح أحد زملائي أن شهادتي في اللغة الإنجليزية ستساعدني في دراسة البرمجة اللغوية العصبية (NLP) لأنها تطبيق للكمبيوتر على النصوص. لم أكن أعرف الكثير عن هذا الموضوع، فجامعتي لم تكن تضم باحثين أو دورات دراسية في هذا المجال.

في النهاية، وجدت مستشاري الحالي، موهيت إيير، الذي كان يعمل على فهم السرد في القصص الطويلة والكتب. لقد أثار هذا اهتمامي حقًا لأنني أحب الكتب وكتبت أطروحة جامعية بعنوان "آليات السرد للإحباط". عندما تقدمت بطلب الالتحاق، اعتقد مستشاري أن هذه آليات تقنية في علوم الكمبيوتر، لكنها لم تكن كذلك — كانت مجرد طريقتي في وصف ما يحدث في الأدب! وجد خلفيتي العلمية مقنعة واعتقد أن خلفيتي في الرياضيات ستساعدني في استيعاب الأساسيات. لقد حضرت أول دورة في البرمجة اللغوية العصبية (NLP) خلال الفصل الدراسي الأول من دراستي للدكتوراه.

دراسة الأدب باستخدام الذكاء الاصطناعي

أخبرنا عن بحثك في الدكتوراه.

عنوان أطروحتي هو "أساليب التعاون بين الإنسان والذكاء الاصطناعي في النصوص: المعايير والمقاييس والمهام التفسيرية". أنا مهتم بفهم كيفية تفسير نماذج اللغة للنصوص واستخلاص استنتاجات أعمق مما قد يستنتجه باحث في العلوم الإنسانية، بدلاً من الاكتفاء بالسمات السطحية.

ركزت الأعمال المبكرة في مجال معالجة اللغات الطبيعية (NLP) على الأدب على استخراج الكيانات المسماة من الكتب، وتخطيط تفاعلات الشخصيات، وإنشاء جداول زمنية تقريبية للأحداث. أنا مهتم أكثر بالمواضيع الشاملة في النصوص بأكملها، وكيف تؤثر دوافع الشخصيات على قراراتهم، وكيف تندرج النصوص في السياق الأوسع لوقت ومكان كتابة المؤلف لها.

أنا أعمل بشكل أساسي على هذه المسألة باعتبارها مشكلة تقييمية — لأرى ما إذا كانت النماذج اللغوية قادرة على استخلاص هذه الأفكار عالية المستوى من النصوص الأدبية.

كيف كان دراسة التحليل الأدبي باستخدام الذكاء الاصطناعي مع ظهور ChatGPT أثناء دراستك للدكتوراه؟

لدي قصة جنونية عن هذا الموضوع. اقترح عملي الأول في الدكتوراه مهمة تسمى "استرجاع الأدلة الأدبية". دائمًا ما يستشهد الباحثون بمقتبسات من النصوص الأصلية في تحليلاتهم، لذا أخذنا فقرات قام فيها باحثون في العلوم الإنسانية بتحليل رواية "الغاتسبي العظيم"، وأخفينا المقتبسات من الرواية، وطلبنا من نماذج اللغة استرجاع تلك المقتبسات.

استخدمت في عملي الأول أداة استرجاع صغيرة وكثيفة تعتمد على RoBERTa لأننا لم نتمكن من إدراج الروايات بأكملها في نماذج اللغة. كتبت حرفياً في قسم الدوافع أننا كنا بحاجة إلى هذا النهج لأننا لم نتمكن من إدراج الروايات بأكملها في السياق.

بعد خمس سنوات، عدت في أحدث أعمالي إلى هذه المهمة باستخدام نماذج لغوية كبيرة يمكنها استيعاب روايات كاملة. في فبراير، جربت هذه المهمة بنفسي لأول مرة — استغرقت ثماني ساعات مع نسخ مطبوعة من الكتب. لم يحقق أي من النماذج نفس النتيجة التي حققتها في 40 مثالاً. ولكن بحلول الوقت الذي تم فيه قبول الورقة البحثية بعد ثلاثة أشهر، كان Gemini Pro 2.5 قد صدر وتفوق عليّ. كانت عينة صغيرة جداً، ولكن كان من المذهل رؤية مدى سرعة تطور الأمور.

في بداية دراستي للدكتوراه، لم أكتب أي ملاحظات. كان ذلك أمراً غير مسبوق. الآن تستخدم أمي LLM في عملها — لم تكن تعرف أبداً ما الذي أعمل عليه، والآن لديها وصول إلى LLM المؤسسي.

كاثرين تدافع عن أطروحتها للدكتوراه

كيف تعتقد أن قراءة LLM تختلف عن قراءة البشر؟

الفرق الأكثر وضوحًا هو السرعة — يستجيب Gemini في غضون 30 ثانية، بينما استغرقت أنا 12 دقيقة في المتوسط لكل مثال. عندما راجعت أخطائي، غالبًا ما لم أكن أتذكر جملًا محددة من روايات تتراوح بين 200 و400 صفحة، بينما كان النموذج يتذكرها بشكل مثالي.

أعتقد أن نماذج اللغة الكبيرة (LLMs) تعالج النص رمزًا رمزًا بطريقة تشبه القراءة المتأنية في التحليل الأدبي، حيث يتم تحليل النص على مستوى الكلمة. ولكن عندما يقرأ البشر 400 صفحة، لا يتم تسجيل كل كلمة كوحدة مميزة في أدمغتنا كما هو الحال في النماذج.

تحدي التقييم

لماذا يعد تصميم تقييمات جيدة أمرًا صعبًا للغاية، ولماذا توجد فجوة كبيرة بين التقييمات الحالية وما يختبره الناس فعليًا مع هذه النماذج؟

إنه التوتر بين الرغبة في توسيع نطاق التقييمات بسرعة باستخدام التقييم التلقائي مقابل الحاجة إلى تقييم دقيق من قبل خبراء بشريين. ركزت الكثير من أعمالي على الاستثمار في توظيف خبراء حقيقيين. بالنسبة للترجمة الآلية للأدب، قمنا بتوظيف مترجمين أدبيين حاصلين على درجة الدكتوراه في الأدب المقارن. كانت رؤاهم مختلفة تمامًا عما يمكن الحصول عليه من مترجمي Mechanical Turk، حتى بالنسبة لاختبارات A/B البسيطة.

الجانب الآخر هو تكلفة إنشاء التقييمات. لقد ساعدت في العمل على وضع معيار مرجعي للوكلاء خلال العام الماضي، حيث قمنا بإنشاء الأسئلة يدويًا وتقييم جميع الوكلاء يدويًا. قضيت على الأرجح شهر مارس بأكمله في مشاهدة مشغل OpenAI وهو ينقر هنا وهناك ويبحث عن أشياء. استغرق الأمر وقتًا طويلاً للغاية حتى لإنجاز 100-150 مثالًا، لكننا تعلمنا الكثير من مراقبة ما يفعله الوكلاء بأعيننا.

هناك توتر مستمر بين الرغبة في توسيع نطاق التقييمات والحاجة إلى تقييم بشري أبطأ وأكثر دقة.

بناء نظام الكشف عن الذكاء الاصطناعي في Pangram

ما الذي تعمل عليه في Pangram؟

أنا أعمل على نموذج يمكنه الكشف عن مدى انتشار الذكاء الاصطناعي في نص ما. نحن نعلم أن الناس لا يكتفون بإنشاء نصوص باستخدام الذكاء الاصطناعي، بل غالبًا ما يأتون بنصوص كتبوها ويطلبون من الذكاء الاصطناعي تحريرها. تتراوح هذه التعديلات بين تصحيحات نحوية بسيطة وإعادة هيكلة كبيرة أو إعادة صياغة كاملة.

نريد قياس هذا التأثير لأننا يمكننا النظر إلى النطاق من النص المكتوب بواسطة الإنسان إلى النص المكتوب بالكامل بواسطة الذكاء الاصطناعي على أنه طيف، مع وجود النص المعدل بواسطة الذكاء الاصطناعي في مكان ما بينهما. نحن نقوم بتدريب نموذج لتحديد المكان الذي قد يقع فيه النص على هذا الطيف.

هذا أمر مهم للغاية لعملائنا في مجال التعليم، ولكننا لاحظنا اهتمامًا من العديد من الجهات الأخرى منذ أن تم دمج نماذج اللغة الكبيرة (LLM) في برامج تحرير النصوص مثل Google Docs. يرغب الناس في معرفة مدى تدخل الذكاء الاصطناعي في نص ما، أي التعديلات التي يمكن "تجاهلها" مقابل تلك التي تقلل العبء المعرفي على المستخدم بشكل كبير.

كاثرين والفريق يعملون حتى وقت متأخر على ورقة بحثية

لماذا قررت الانضمام إلى Pangram كباحث مؤسس؟

أنا أحب الفريق هنا. لقد حقق برادلي وماكس نجاحًا باهرًا مع الفريق المؤسس. أقضي 90٪ من وقتي مع موظفي Pangram، ولكن بصراحة لا أريد أن يكون الأمر مختلفًا عن ذلك، كما يتضح من تمريني مع الجميع خلال الأيام العشرة الماضية!

من الرائع حقًا أن يكون لديك مكتب تذهب إليه. كنت طالب دكتوراه عن بُعد لفترة من الوقت، ومن الممتع أن يكون لديك مكان يعمل فيه الجميع لتحقيق هدف مشترك. بدأت دراسة الدكتوراه مباشرة بعد التخرج خلال السنة الأولى من جائحة كوفيد، لذا كانت الدراسة عن بُعد تمامًا ولم يكن لدي مكان أذهب إليه. لم يسبق لي أن عملت في مكتب أو حصلت على "وظيفة عادية".

برادلي هو أحد أذكى الأشخاص الذين عملت معهم على الإطلاق — وهذا ليس مبالغة. أشعر أنني تعلمت الكثير وأكتسبت خبرة عملية في أمور لم أتمكن من القيام بها خلال دراستي للدكتوراه. عندما ظهرت نماذج اللغة الكبيرة (LLM)، أراد الجميع إجراء أبحاث عليها ونسينا أمر النمذجة. لم يكن هناك فائدة من محاولة تدريب نموذجك الخاص لمواكبة المختبرات الكبيرة، لذلك لم أقم بالكثير من النمذجة باستثناء بعض التعديلات الدقيقة.

لقد كان من الرائع اكتساب مهارات عملية. أنا لست مهندس برمجيات جيد لأنني باحث، لذا كان ذلك ممتعًا. ساعدني إلياس اليوم في حل مشكلات GitHub لمدة نصف ساعة! والقدرة على العمل مع أشخاص أذكياء، وإجراء البحوث، والتواجد في بروكلين — إنه موقع رائع وأنا أحب الساحل الشرقي.

متشكك في الذكاء الاصطناعي في مجال أبحاث الذكاء الاصطناعي

أنت متشكك في الذكاء الاصطناعي أكثر من كونك متفائلاً به، ولا تدمج الذكاء الاصطناعي كثيراً في حياتك اليومية. ما الذي يدعم هذا التشكك؟

شيئان. على نطاق صغير، أنا الوحيد من بين أصدقائي المقربين في الجامعة الذي دخل مجال أبحاث علوم الكمبيوتر. الآخرون يعملون في مجال الاكتواريات ولم يكونوا على علم بنمذجة اللغة عندما ظهرت. بدأوا يسمعون عن ChatGPT عندما أضاف Instagram الذكاء الاصطناعي إلى أشرطة البحث وميزات الدردشة. لفترة طويلة، كنت الوحيد الذي يعرف عن هذه التقنيات، لكن أصدقائي بدوا راضين عن العيش بدونها. أدركت مدى تأثير الذكاء الاصطناعي على عقلي، بينما كانوا هم يعيشون في سعادة دون أن يدركوا ذلك، ولكنهم كانوا بخير.

كنت في هذه الغرفة المليئة بأشخاص إما متشائمين بشأن الذكاء الاصطناعي أو متحمسين للغاية بشأن نماذج اللغة الكبيرة (LLMs)، ولكن هذا ليس ما يتحدث عنه 95٪ من الناس.

على الصعيد الفلسفي، من خلال رحلتي في الكتابة - حيث تعلمت أنني لا أريد الكتابة ولكنني أحب التحليل - أدركت أنني لا أقدر سوى النصوص التي يكتبها البشر. لا يهمني ما يكتبه نماذج اللغة الكبيرة (LLM) أو ما إذا كانت قادرة على القيام بمهام التحليل الأدبي، لأنني أعتقد أن القدرة على القيام بهذه الأشياء هي قيمة بالنسبة للبشر. إنها مهارة يمكن أن يمتلكها البشر، ولكنني لا أعتقد أن امتلاك نماذج اللغة الكبيرة (LLM) لهذه المهارة يعني أي شيء.

الكتابة مهمة إنسانية للغاية، وأنا أقدر حقًا أن يكون هناك إنسان وراءها. هذا جعلني سيئًا في اكتشاف النصوص التي كتبتها الذكاء الاصطناعي لأنني ببساطة لا أقرأ النصوص التي كتبتها الذكاء الاصطناعي!

الحياة خارج العمل

ماذا تحب أن تفعل للتسلية خارج العمل؟

أحب تمشية كلابي في بروكلين — لدي كلبان، أحدهما يحب المشي لمسافات طويلة. أحب ممارسة الرياضة وقراءة الروايات، كما أنني مولعة بالحياكة والكروشيه.

لقد حددت هدفًا صيفيًا يتمثل في ممارسة التمارين مع جميع أعضاء فريق Pangram. ما هي التمارين المفضلة لديك حتى الآن؟

أعتقد أن التسلق مع لو، وهو أمر جيد لأننا على وشك القيام بذلك مرة أخرى في غضون 45 دقيقة! التسلق نشاط اجتماعي للغاية لأنك تأخذ استراحات بين المحاولات، لذا تتحدث وتقضي الوقت مع الآخرين.

لقد مارست رياضة الكيك بوكسينغ التي كانت عالية الكثافة طوال الوقت باستخدام أكياس فردية، لذا لم تكن موجهة للفريق. وقمت بتمرين آخر مع مؤسسي شركتنا كان فوضوياً طوال الساعة — لم تكن هناك فرصة للتحدث، كنا نحاول فقط البقاء على قيد الحياة! كان المعنويات مرتفعة في بعض الأحيان، على الرغم من أنها ربما كانت منخفضة بالنسبة لماكس في بعض الأوقات. كانت تجربة رائعة لتقوية الروابط بين أعضاء الفريق، لكن التسلق يفوز باعتباره الأكثر اجتماعية.

نصائح للباحثين الطموحين

ما النصيحة التي تقدمها لشخص يرغب في دخول مجال أبحاث التعلم الآلي؟

أمران أساسيان: لا تحاول القيام بالمشاريع بنفسك. يقع بعض طلاب الدكتوراه الجدد في هذا الفخ، ولكن عليك التعاون مع أشخاص أكثر خبرة منك. إذا كان هذا هو مشروعك الأول، فلا بأس بصراحة إذا كانوا يفعلون أشياء تثير دهشتك وتثير إعجابك — ستتعلم الكثير من العمل مع أشخاص أذكياء للغاية.

ثانياً، عليك أن تجرب هذه الأشياء بنفسك وتخرج من منطقة الراحة الخاصة بك. لقد تعلمت لغة Python فقط من خلال قراري باستخدامها كلغة وحيدة في أحد الصيفيات لمشروع بحثي. كن عملياً للغاية في كل شيء، بما في ذلك الرياضيات — اكتب المشتقات يدوياً!

لقد أصبحت مدمنًا على Math Academy منذ ستة أشهر، وهو أمر جنوني ولكنه رائع للعودة إلى أساسيات الرياضيات.

كاثرين في بانجرام


حصلت كاثرين مؤخراً على درجة الدكتوراه في علوم الكمبيوتر من جامعة ماساتشوستس أمهرست، وستنضم إلى Pangram Labs بدوام كامل كأول عالمة أبحاث مؤسسة لدينا. عندما لا تكون مشغولة بتدريب نماذج الكشف عن الذكاء الاصطناعي أو تحليل الأدب باستخدام نماذج اللغة، يمكنك أن تجدها تمشي مع كلابها في بروكلين أو تخطط للتمرين الجماعي التالي.

اشترك في نشرتنا الإخبارية
نشارك تحديثات شهرية حول أبحاثنا في مجال الكشف عن الذكاء الاصطناعي.