اوپنایآی در گزارشی تازه اعلام کرد دلیل اصلی اشتباههای عجیب چتباتها در ساختار آموزش و ارزیابی آنها نهفته است.
این خطاها ناشی از آن است که مدلها برای «حدس زدن» پاداش میگیرند، نه برای سکوت یا ابراز تردید.
پژوهشگران میگویند در سیستم امتیازدهی فعلی، مثل امتحان مدرسه، سکوت نمرهای ندارد اما یک پاسخ احتمالی حتی اگر غلط باشد امتیاز دارد.
به همین دلیل مدلها با اعتمادبهنفس جواب میدهند، حتی وقتی اشتباه میکنند.
راهکار اوپنایآی، نه بازطراحی کامل مدلها، بلکه اصلاح معیارهای ارزیابی است؛ یعنی سکوت یا «نمیدانم» نباید بهعنوان ضعف محسوب شود.