۲۳ آذر ۱۴۰۴
به روز شده در: ۲۳ آذر ۱۴۰۴ - ۲۱:۴۹
فیلم بیشتر »»
کد خبر ۱۱۲۳۰۹۴
تاریخ انتشار: ۰۷:۴۷ - ۲۳-۰۹-۱۴۰۴
کد ۱۱۲۳۰۹۴
انتشار: ۰۷:۴۷ - ۲۳-۰۹-۱۴۰۴

هوش مصنوعی همه‌چیزدان نیست؛ دقت ۶۹ درصدی پیشرفته‌ترین مدل‌ها

هوش مصنوعی همه‌چیزدان نیست؛ دقت ۶۹ درصدی پیشرفته‌ترین مدل‌ها
آمار جدید محققان گوگل نشان می‌دهد که حتی پیشرفته‌ترین مدل هوش مصنوعی موجود دقت ۶۹ درصدی دارد.

گوگل تصویری نگران‌کننده از میزان دقت هوش مصنوعی در بیان حقایق به دست آورد. گوگل دیپ‌مایند هفته‌ی گذشته از مجموعه‌ی بنچمارک FACTS رونمایی کرد؛ ابزاری برای سنجش اعتبار و درستی پاسخ‌های مدل‌های AI.

به گزارش زومیت، این بنچمارک مدل‌ها را در چهار حوزه‌ی کلیدی به چالش می‌کشد: پاسخ به پرسش‌های واقعی بر اساس دانش درونی، استفاده‌ی مؤثر از جست‌وجوی وب، استناد دقیق به اسناد طولانی و تفسیر تصاویر. در این آزمون، جمنای ۳ پرو گوگل با کسب امتیاز ۶۹ درصد، بهترین عملکرد را به ثبت رساند؛ درحالی‌که سایر مدل‌های پیشرو با اختلاف فاحشی پایین‌تر از این سطح قرار گرفتند.

آمار مذکور باید زنگ خطری جدی برای کسب‌وکارهایی باشد که روی هوش مصنوعی شرط بسته‌اند. اگرچه مدل‌ها در سرعت و شیوایی کلام بی‌نظیرند؛ اما قابلیت اطمینان آن‌ها در بیان حقایق همچنان فرسنگ‌ها با انتظارات انسانی فاصله دارد؛ به‌ویژه در وظایفی که نیازمند دانش تخصصی، استدلال پیچیده یا استناد دقیق به منابع هستند.

حتی خطاهای واقعی کوچک در صنایعی مانند امور مالی، بهداشت و درمان و حقوق می‌توانند پیامدهای ویرانگری به‌همراه داشته باشند. یکی از خبرنگاران روایت می‌کند که چگونه یک شرکت حقوقی، کارمندش را به دلیل استفاده از ChatGPT در تنظیم لایحه‌ای که مملو از پرونده‌های ساختگی بود، اخراج کرد.

بنچمارک FACTS هم هشدار است و هم نقشه‌ی راه؛ گوگل امید دارد با کاهش نقاط شکست و نحوه‌ی خطای مدل‌ها، پیشرفت در این حوزه را شتاب ببخشد. اما فعلاً پیام روشن است: هوش مصنوعی بهتر می‌شود؛ اما همچنان در حدود یک‌سوم موارد اشتباه می‌کند.

ارسال به دوستان
عذرخواهی صریح خداداد عزیزی؛ «وجودش را دارم بگویم جمله تلویزیونی‌ام خوب نبود» شورای آتلانتیک: ادامه آتش‌بس ایران و اسرائیل احتمالا به مهار نتانیاهو توسط ترامپ وابسته خواهد بود فتق دیسک کمر؛ 7 تمرین ساده که باید انجام دهید و فعالیت هایی که باید از آن ها پرهیز کنید (+تصاویر تمرین ها) معماری خشن یک کلیسا برای روستای 200 نفره (+عکس) معماری خانه نوجان؛ تحول یک اسکلت محدود به حجم‌های چرخشی در دامغان (+عکس) شورای نگهبان لایحه دوفوریتی دولت را رد کرد بالاخره سود سهام عدالت قبل از شب یلدا واریز می شود؟ پیام تسلیت مقام معظم رهبری در پی درگذشت شاهچراغی چالش حل‌نشده رپ فارسی و تناقض‌های سیاست فرهنگی؛ «گنگ» علی ضیاء، خط قرمزی جدید را جابجا کرد؟ سعید جلیلی درباره ماجرای ضد گلوله کردن پرایدش: آنهایی که برای مسخره کردن این موضوع را مطرح می‌کنند در حال توجیه بنزسواری هستند افزایش شمار کشته‌های حمله استرالیا به ۱۲ نفر ادامه تعقیب و گریز در لیگ برتر انگلیس؛ سیتی با درخشش هالند به صدر جدول نزدیک شد تصویب کلیات لایحه بودجه ۱۴۰۵ در هیئت دولت واشنگتن‌پست: طالبان تصاویر هواپیماهای نظامی را در پایگاه هوایی بگرام نقاشی کرده ابهام در قرارداد ماشاریپوف؛ هافبک ازبکستانی استقلال به خرم‌آباد نرفت