تاریخ:

۲۲ بهمن ۱۴۰۴

به روز شده در: ۲۲ بهمن ۱۴۰۴ - ۰۴:۰۰

مغز متفکر حکومت رضاشاه چگونه به زندگی خود پایان داد؟

سالگرد پرواز هواپیمایی که دنیا را تکان داد(+عکس)

قدیمی ترین ها در دنیا/ باستانی ترین کنکور

فیلم بیشتر »»

موج برکناری زنان متخصص در میراث فرهنگی ایران / غیر متخصصین همچنان بر صندلی قدرت نشسته‌اند

گل دوم السد به تراکتور توسط فیرمینو

آموزش زبان انگلیسی بیشتر »»

درس هفدهم

درس شانزدهم

در حاشیه

دهه 70؛ دورهمی محمد نوری، عباس کیارستمی و عباس یاری» (عکس)

سال 1402؛ غلام، ناصر و ایاز در پشت صحنه سریال سوجان(عکس)

دهه 60؛ سارا خوئینی‌ها و چنگیز وثوقی در اوایل ازدواج شان (عکس)

کامنت تهمینه میلانی زیر پست گلشیفته فراهانی (عکس)

بازیگر نقش کودکی «دونگ یی و چان سو» در 26 و 49 سالگی (عکس)

100 سالگی

این ۳۰ نفر حق ندارند در تهران رانندگی کنند! +عکس

اولین سیگار وینستون ایرانی ۵۰ ساله شد!

عکس و گزارش از ۵ قلوهای تاریخی تهران!

حراج لباس‌های شمس پهلوی، خواهر شاه در کرج! +عکس

عکس‌های دیده‌نشده از تصرف زندان قصر توسط مردم!

باشگاه مغز

معمای مثلث ها؛ خیلی ها نمی توانند زیر 30 ثانیه این معما را حل کنند!

معمای ریاضی؛ اگر زیر 30 ثانیه جواب را پیدا کنید، یک نابغه هستید!

تست بینایی و تمرکز؛ 90 درصد افراد در پیدا کردن این جغد شکست می خورند؛ شما چطور؟

معمای ریاضی لوزی های جادویی؛ عدد مجهول را پیدا کنید!

تست 10 ثانیه ای بینایی: یک سرگرمی نه چندان دشوار

سریع ترین زمان حل این معما 10 ثانیه بوده؛ شما چه رکوردی را ثبت می کنید؟!

یک بستنی متفاوت را گم کرده ایم/ آیا می توانید زیر 5 ثانیه رکورد بزنید؟! (معمای تصویری)

صفحه نخست » فناوری

کد خبر ۱۱۱۸۶۶۶

‍‍‍ پ پ ‍‍‍

تاریخ انتشار: ۰۷:۵۵ - ۰۹-۰۹-۱۴۰۴

‌گزارش خطا در خبر

صفحه نخست » فناوری

کد ۱۱۱۸۶۶۶

انتشار: ۰۷:۵۵ - ۰۹-۰۹-۱۴۰۴

میزان توهم زدن مدل‌های هوش مصنوعی بر اساس پاسخ‌های نادرست یا ناقص (+ اینفوگرافی)

بالا‌ترین نرخ توهم هوش مصنوعی مربوط به Grok‑۳ با ۹۴ درصد بود، به این معنی که تقریباً تمام پاسخ‌های آن اشتباه بودند.

بسیاری از مدل‌های هوش مصنوعی امروز هنگام شناسایی و استناد به منابع خبری از یک متن، دچار مشکل شده و خطاهای زیادی تولید می‌کنند.

به گزارش روزیاتو، بالا‌ترین نرخ توهم هوش مصنوعی مربوط به Grok‑۳ با ۹۴ درصد بود، به این معنی که تقریباً تمام پاسخ‌های آن اشتباه بودند.

آیا هوش مصنوعی شما همیشه پاسخ درست می‌دهد؟ متأسفانه، «حقیقت» ارائه شده توسط آن ممکن است توهم باشد.

این اینفوگرافی، نرخ توهمات هوش مصنوعی را بر اساس مدل‌ها نشان می‌دهد.

توهم هوش مصنوعی چیست؟

«توهم هوش مصنوعی» به مواردی گفته می‌شود که در آن مدل زبانی اطلاعات نادرست یا بدون منبع را به عنوان حقیقت به کاربر ارائه می‌دهد.

این توهمات به این دلیل اتفاق می‌افتند که سیستم‌های آموزش استاندارد، حدس زدن را به جای نشان دادن عدم اطمینان، پاداش می‌دهند. تصور کنید که در یک تست چندگزینه‌ای حدس بزنید؛ احتمال اینکه درست باشد بیشتر از زمانی است که هیچ پاسخی ندهید.

نرخ توهمات هوش مصنوعی: بهترین و بدترین مدل‌ها

برای اندازه‌گیری نرخ توهمات، محققان مدل‌های شرکت‌های پیشرو در حوزه هوش مصنوعی را با متون خبری آزمایش کردند و از آن‌ها خواستند مقاله، رسانه و URL اصلی را مشخص کنند.

نکته مهم اینکه محققان، متونی را انتخاب کردند که اگر در گوگل جستجو شوند، منبع اصلی در سه نتیجه اول ظاهر می‌شود.

سپس پاسخ‌های مدل‌های هوش مصنوعی برای دقت بررسی شدند. جدول زیر نشان می‌دهد هر مدل چند درصد پاسخ نادرست یا ناقص داده است:

مدل هوش مصنوعی	نرخ توهم
Perplexity	۳۷ درصد
Copilot	۴۰ درصد
Perplexity Pro	۴۵ درصد
ChatGPT Search	۶۷ درصد
Deepseek Search	۶۸ درصد
Gemini	۷۶ درصد
Grok-2 Search	۷۷ درصد
Grok-3 Search	۹۴ درصد

Grok‑۳ بدترین عملکرد را داشت و ۹۴ درصد پاسخ‌هایش توهم بود، در حالی که Perplexity دقیق‌ترین پاسخ‌ها را ارائه کرد.

نکته جالب اینکه مدل‌های پولی حتی در مواردی از نسخه‌های رایگان ضعیف‌تر عمل کردند. اکثر مدل‌ها نیز، باوجود خطاهای زیاد، هیچ نشانه‌ای از عدم اطمینان در پاسخ‌هایشان نشان ندادند.

پربیننده ترین پست همین یک ساعت اخیر

خبر پیروزی انقلاب از رادیو را چه کسی اعلام کرد؟/ "اینجا تهران است، صدای راستین ملت ایران" یا "این صدای انقلاب اسلامی ایران است"....

خبر بعد نظرات کاربران خبر قبل

اشتراک گذاری :

عضویت در کانال تلگرام عصر ایران

مغز متفکر حکومت رضاشاه چگونه به زندگی خود پایان داد؟

بیشتر بخوانید:

هوش مصنوعی و پیش‌بینی زمان تقریبی مرگ

هوش مصنوعی افکار را به جمله تبدیل می‌کند

«هوش مصنوعی» قدرت تولید کدام کشورها را بیشتر می‌کند؟ (اینفوگرافیک)

تماشاخانه