مقدمه
هدف از این مطالعه مقایسه توانایی مدلهای بزرگ زبان (مانند سیستمهای پیشرفته هوش مصنوعی) و انسانها در درک افکار و احساسات دیگران بود، مهارتی که به عنوان «نظریه ذهن» شناخته میشود. این مهارت به ما کمک میکند رفتارهای دیگران را پیشبینی و تفسیر کنیم. محققان میخواستند ببینند آیا این سیستمهای هوش مصنوعی میتوانند وظایفی را که نیاز به درک حالات ذهنی انسان دارند به دقت انجام دهند یا خیر.
روش اجرا
برای آزمایش این موضوع، محققان مجموعهای از وظایف طراحی کردند که هم انسانها و هم سیستمهای هوش مصنوعی میتوانستند آنها را انجام دهند. این وظایف شامل سناریوهایی بودند که شرکتکنندگان باید بر اساس اطلاعات ارائهشده، حدس میزدند که شخص دیگری چه فکر یا احساسی دارد. با این حال، این مطالعه محدودیتهایی داشت:
- اندازه نمونه: تعداد شرکتکنندگان انسانی ممکن است کم بوده باشد که میتواند بر اعتبار نتایج تأثیر بگذارد.
- طراحی وظایف: وظایف ممکن است نتوانند به طور کامل پیچیدگی موقعیتهای واقعی را که در آنها نظریه ذهن استفاده میشود، منعکس کنند.
- محدودیتهای هوش مصنوعی: مدلهای فعلی هوش مصنوعی ممکن است در درک زمینه و نکات ظریف رفتار انسانی محدودیتهایی داشته باشند.
نتایج و بحث
مطالعه نشان داد که در حالی که مدلهای بزرگ زبان میتوانند برخی از وظایف نظریه ذهن را انجام دهند، اما به اندازه انسانها دقیق یا مداوم نبودند. انسانها در درک نکات ظریف افکار و احساسات دیگران بهتر بودند. این یافتهها نشان میدهند که در حالی که سیستمهای هوش مصنوعی در حال بهبود هستند، هنوز راه زیادی در پیش دارند تا بتوانند حالات ذهنی انسان را به طور کامل درک کنند. این موضوع کاربردهای عملی در زمینههایی که نیاز به درک اجتماعی دارند، مانند خدمات مشتری یا درمان، دارد. به طور خلاصه، این مطالعه نقاط قوت و ضعف سیستمهای هوش مصنوعی فعلی را در درک افکار و احساسات انسانی برجسته میکند و نشان میدهد که قضاوت انسانی همچنان در تعاملات اجتماعی پیچیده برتر است.
منبع
- Strachan, J. W. A., Albergo, D., Borghini, G., Pansardi, O., Scaliti, E., Gupta, S., Saxena, K., Rufo, A., Panzeri, S., Manzi, G., Graziano, M. S. A., & Becchio, C. (2024). Testing theory of mind in large language models and humans. Nature Human Behaviour 8(7), 1285–1295.
“`