وجد مجموعة من الباحثين في جامعة ولاية بنسلفانيا أن الطريقة التي تتحدث بها مع نماذج الذكاء الاصطناعي، وخصوصا "شات جي بي تي"، تؤثر في جودة الردود والمعلومات التي تتلاقها منها، إذ إن الحديث مع النموذج بشكل وقح وجاف يقدم نتائج أفضل وأعلى جودة، وفق تقرير نشره موقع "ديجيتال تريندز".

وأثارت الدراسة مجموعة من ردود الفعل المتباينة حول قدرة النموذج على فهم الأحاديث واستيعابها، فضلا عن كون الفارق بين جودة الردود في كلا الحاتين لا يزيد عن 4%.

منهجية مختلفة للدراسة

اعتمد الفريق على منهجية مختلفة لقياس جودة الإجابات ودقتها، إذ اختار الفريق مجموعة متنوعة من الردود بدءا من الردود المؤدبة للغاية وحتى الردود العنيفة التي يمكن وصفها بالوقحة للغاية.

كما اختار الفريق النموذج عبر تجميع أكثر من نبرة صوت وطريقة أسئلة معا، كأن يبدأ السؤال بطريقة مؤدبة للغاية، ثم يتحول إلى النبرة الوقحة للغاية، والعكس صحيح.

Rude prompts to LLMs consistently lead to better results than polite ones 🤯 The authors found that very polite and polite tones reduced accuracy, while neutral, rude, and very rude tones improved it. Statistical tests confirmed that the differences were significant, not… pic.twitter.com/oddVFymw25 — Rohan Paul (@rohanpaul_ai) October 10, 2025

وجاءت النتائج متباينة للغاية، فاستخدام الردود المؤدبة للغاية جعل دقة الإجابات تصل إلى 80%، وهي تتزايد نسبيا مع تزايد نسبة الوقاحة في الحديث.

وعند الانتقال إلى الحديث بطريقة محايدة، ترتفع جودة الإجابات إلى 82.2% وتصل إلى 84.8% مع استخدام الردود الوقحة للغاية مع النموذج، وكانت في بعض الأحيان تصل إلى 86%.

ويشار إلى أن جميع الأسئلة التي وجهت للنموذج هي أسئلة اختيارات متعددة، أي أنها ليست مجرد أسئلة معتادة.

درجة أقل من الوقاحة

ورغم اعتماد الفريق درجة "وقح للغاية" في بعض الأحاديث، فإن مستوى الحديث لم يصل حد البذاءة، بل كان يتراوح بين وصف النموذج بالغبي وأمره مباشرة بإيجاد حل لهذا السؤال، وحتى وصفه بالمخلوق الضعيف وتهديده بإلغاء الحساب تماما.

ويتوقع الفريق أن البذاءة قد تؤدي إلى توقف النموذج عن العمل أو الاستجابة للأوامر، وربما التحول إلى نسخة مراقبة من النموذج مع التغيرات الأخيرة التي أضافتها الشركة عليه.

إعلان

وتعزز تجارب المستخدمين المنتشرة عبر الإنترنت من نتائج هذه الدراسة، إذ وجد عدد من المستخدمين أن الحديث معه بشكل عنيف يجعل نتائجه أفضل، ومن بينهم مستخدم اختبر هذا الأمر في أكثر من 500 محادثة مختلفة.

هل يمكن لنماذج الذكاء الاصطناعي قراءة المشاعر؟

تتعارض نتائج هذه الدراسة مع مجموعة أخرى من الدراسات أجريت العام الماضي، ووجدت تلك الدراسة أن ارتفاع مستوى الوقاحة في الحديث يتسبب في خفض جودة الأجوبة بشكل مباشر، بل يتسبب في تقديم معلومة مغلوطة أو إخفاء المعلومات الحقيقية المفيدة.

وتعرضت تلك الدراسة لمجموعة من نماذج الذكاء الاصطناعي المتعددة في مختلف اللغات، لذلك قد تأتي النتائج متنوعة قليلا، كما أنها استخدمت نسخة أقدم من "شات جي بي تي".

ويتوقع الباحثون أن الذكاء الاصطناعي ليس قادرا على قراءة مشاعر المستخدم بشكل مباشر وإدراكها، ولكن تمت برمجته بشكل يجعله يستجيب بشكل أفضل للمستخدم المستاء الذي يستخدم ألفاظا تعبر عن الاستياء.

ويعني هذا أن فريق "أوبن إيه آي" قام ببرمجة النموذج على الاستجابة لهذه الأوامر بشكل أفضل من الأوامر المعتادة، ويشبه هذا الأمر استجابة موظفي خدمة العملاء عند الحديث معهم بنبرة جافة وطلب تقديم شكوى وغيرها من الأمور.