مقدمه
مدلهای زبان بزرگ (LLM) که اخیراً به طور قابل توجهی پیشرفت کردهاند، یکی از بزرگترین دستاوردها در زمینه هوش مصنوعی به شمار میروند. این مدلها میتوانند دستورالعملهای پیچیدهای که به زبان طبیعی انسان نوشته شده را درک کرده و پاسخهایی شبیه به انسان ایجاد کنند. یکی از پیشرفتهترین این مدلها، GPT-4 است که تواناییهای چشمگیری در زمینههایی مانند استدلال منطقی، درک مطلب و حساب دارد. قابلیت تنظیم و هدایت پاسخهای GPT-4، به کاربران این امکان را میدهد که پاسخها را با توجه به نیاز خود از نظر محتوا، سبک یا لحن تنظیم کنند.
این قابلیتهای نقشآفرینی GPT-4 میتواند به تحقیقات جدیدی در علوم اجتماعی کمک کند. مفهوم مدلسازی مبتنی بر عاملها (Agent-Based Modeling یا ABM) که سالها پیش مطرح شد، روشی است برای شبیهسازی رفتار افراد یا گروهها به منظور درک بهتر سیستمها و عوامل موثر بر آنها. به دلیل محدودیتهای محاسباتی در گذشته، استفاده از این مدلها در شبیهسازیهای پیچیده انسانی دشوار بود، چرا که شبیهسازی رفتار انسان با پیچیدگیهای روانشناختی سخت بود.
اما حالا مدلهای زبانی پیشرفته مثل GPT-4 میتوانند رفتارهای پیچیدهتر و واقعیتری را شبیهسازی کنند و به تحقیقات اجتماعی کمک کنند. برای استفاده از این مدلها در تحقیقات، لازم است که توانایی آنها برای شبیهسازی شخصیتهای واقعی یا دستکم شخصیتهای قابل قبول انسان بررسی شود.
این تحقیق جدید به ارزیابی توانایی GPT-4 برای شبیهسازی شخصیتهای انسانی با استفاده از ویژگیهای پنج عامل اصلی شخصیت پرداخته است. هدف این مطالعه ارائه پروتکلی استاندارد و معتبر برای ارزیابی توانایی مدلهای زبان بزرگ در شبیهسازی شخصیت انسان است که میتواند به پژوهشگران در آینده کمک کند تا ویژگیهای روانشناختی این مدلها را بهتر درک و ارزیابی کنند.
در نهایت، این تحقیق به پژوهشگران روشهای علمی و روانشناختی قابل اعتمادی ارائه میدهد تا بتوانند توانایی مدلهای زبان بزرگ در شبیهسازی رفتارهای انسانی را به درستی ارزیابی کنند.
روش اجرا
محققان دو آزمایش شبیهسازی اصلی را انجام دادند:
- شبیهسازی 1: به GPT-4 دستورات طراحی شدهای داده شد که شخصیت 400 نفر را نمایندگی کند. سپس هوش مصنوعی بهعنوان این افراد، پرسشنامههای شخصیتی را تکمیل کرد. محققان بررسی کردند که پاسخهای تولید شده توسط هوش مصنوعی تا چه اندازه با پاسخهای افراد واقعی سازگار و معتبر بودند.
- شبیهسازی 2: این بار، اطلاعات دموگرافیک مانند سن و ملیت نیز اضافه شد تا ببینند آیا این اطلاعات بر عملکرد GPT-4 تأثیر میگذارد یا خیر. آنها میخواستند بدانند آیا این جزئیات اضافی باعث میشود پاسخهای هوش مصنوعی در پیشبینی عواملی مانند سلامتی یا رضایت شغلی واقعیتر باشد.
محدودیتها: مطالعه نشان داد که اگرچه GPT-4 میتواند پروفایلهای شخصیتی سازگار ایجاد کند، دقت آن در سناریوهای پیچیدهتر کاهش مییابد. همچنین، از آنجا که همه افراد در شبیهسازی دوم بریتانیایی و 50 ساله بودند، عدم تنوع ممکن است یافتههای مطالعه را محدود کند.
نتایج و بحث
یافتههای شبیهسازی 1:
- GPT-4 امتیازات شخصیتی بسیار سازگاری تولید کرد، حتی در برخی موارد بیشتر از افراد واقعی.
- پاسخهای هوش مصنوعی به خوبی با ویژگیهای شخصیتی واقعی انسانها همخوانی داشت، نشان میدهد که میتواند این ویژگیها را بهدقت تقلید کند.
یافتههای شبیهسازی 2:
- اضافه کردن جزئیات دموگرافیک گاهی اوقات امتیازات شخصیتی هوش مصنوعی را تغییر داد اما پیشبینیهای آن از عوامل خارجی مانند سلامتی را بهبود بخشید.
- توانایی هوش مصنوعی در پیشبینی رفتارها زمانی که زمینه دموگرافیک اضافی داشت بهتر بود، که نشان میدهد شخصیت و دموگرافیک با هم تصویری کاملتر ارائه میدهند.
اهمیت:
این مقاله به بررسی توانایی مدلهای زبان بزرگ (LLM) مانند GPT-4 در شبیهسازی ویژگیهای شخصیتی انسانها میپردازد. نتایج نشان میدهد که GPT-4 توانایی بالایی در بازنمایی شخصیتهای مختلف انسانها بر اساس پنج بعد اصلی شخصیت (Big Five) دارد و این کار را با دقت بالایی انجام میدهد.
بر اساس تحقیقات انجامشده، نتایج به دست آمده از این مدل نشاندهندهی همبستگی بالا و سازگاری زیاد با نتایج واقعی (ground truth) در شبیهسازی شخصیتهاست. این بدان معناست که GPT-4 میتواند ویژگیهای شخصیتی مختلف را با دقت بالایی شبیهسازی کند، اگرچه این شبیهسازی ممکن است با روشهای انسانی در ارزیابی سوالات تفاوتهایی داشته باشد. برای مثال، زمانی که از GPT-4 خواسته شد تا خودش را توصیف کند که «آیا من زندگی مهمانی هستم؟»، این مدل پاسخ داد که چون نمره بالایی در ویژگی برونگرایی دارد، باید خود را فردی توصیف کند که در محیطهای اجتماعی راحت است و میتواند مرکز توجه باشد.
نتایج تحقیق نشان میدهد که برای شبیهسازی شخصیت دقیقتر، افزودن اطلاعات جمعیتشناختی مانند سن و محل سکونت میتواند کمک کند. این ویژگیها باعث میشود که مدل، پیشبینیهای دقیقتری در مورد رفتارهای فردی انجام دهد.
مقاله همچنین پیشنهاد میدهد که در آینده میتوان از این مدلها در تحقیقاتی که نیاز به شبیهسازی رفتارهای انسانی پیچیده دارند استفاده کرد. برای مثال، میتوان از مدلهای زبان برای بررسی دینامیکهای گروهی یا تعاملات بین افراد استفاده کرد. البته هنوز چالشهایی مانند تأثیر متغیرهای جمعیتشناختی بر دقت پیشبینیها وجود دارد که باید بررسی شوند.
در نهایت، این تحقیق به محققان روشی استاندارد و معتبر برای ارزیابی عملکرد مدلهای زبان در شبیهسازی ویژگیهای شخصیتی انسانها پیشنهاد میدهد و به استفاده از این مدلها در تحقیقات روانشناختی و شبیهسازیهای پیچیده اجتماعی تأکید دارد.
منبع
-
Wang, Y., Zhao, J., Ones, D.S. et al. Evaluating the ability of large language models to emulate personality. Sci Rep 15, 519 (2025).