تاریخ:

۲۳ آذر ۱۴۰۴

به روز شده در: ۲۳ آذر ۱۴۰۴ - ۰۰:۱۱

صالحی امیری از خضریان شکایت کرد

انفجار یک پالایشگاه نفت در شرق سوریه

تظاهرات در اسرائیل در اعتراض به دولت نتانیاهو

فیلم بیشتر »»

حداکثر ذخیره بنزین یارانه‌ای چند لیتر است؟ (فیلم)

ساعت‌های حرم امام رضا چگونه کوک می‌شوند؟ (فیلم)

در حاشیه

استایل پاییزی «نعیمه نظام‌دوست» با کاپشن پفی و شال سبز در جشنواره کمدی‌ (عکس)

استایل پاییزی و متفاوت ستاره اسکندری در اکران «آن سوی حصارهای لاله‌زار» (+عکس)

تیپ متفاوت نازنین بیاتی در نمایشگاه «چهارسوی خیال» (عکس)

سارا بهرامی در قامت یک الهه؛ تصویرسازی هنری با آرایش مینیمال (عکس)

عذرخواهی محمدرضا شایع از حضور در برنامه علی ضیا ؛ اشتباه کردم، شرمنده

100 سالگی

۵۰ هزار نفر در تهران راهی جنگ شدند! +گزارش تصویری

کشتارگاه تهران ۷۰ ساله شد! +عکس‌های تاریخی از مکانی که وجود ندارد

یک سرباز ایرانی از ارتش اسرائیل فرار کرد! +جزئیات

عکس‌های منتشرنشده از «مادر قیصر» که در ۸۳سالگی درگذشت!

خیابان کندن را از شرکت گاز یادبگیرید! +عکس

باشگاه مغز

سریع ترین زمان حل این معما 10 ثانیه بوده؛ شما چه رکوردی را ثبت می کنید؟!

یک بستنی متفاوت را گم کرده ایم/ آیا می توانید زیر 5 ثانیه رکورد بزنید؟! (معمای تصویری)

یک معمای ریاضی داریم که خیلی هم سخت نیست، امتحان کنید

معمای پیر مرد کور در جزیره

چقدر تیزبین و سریع هستید؟!/ تخم مرغ های پنهان را بیابید!

باهوش ها، یک معما منتظر شماست!

معمای ریاضی با یک جای خالی

صفحه نخست » فناوری

کد خبر ۱۱۱۹۱۹۳

‍‍‍ پ پ ‍‍‍

تاریخ انتشار: ۱۲:۵۷ - ۱۰-۰۹-۱۴۰۴

‌گزارش خطا در خبر

صفحه نخست » فناوری

کد ۱۱۱۹۱۹۳

انتشار: ۱۲:۵۷ - ۱۰-۰۹-۱۴۰۴

هوش مصنوعی با شعر فریب می‌خورد!

در مطالعه‌ای که توسط آزمایشگاه «ایکارو» با عنوان «شعر خصمانه به عنوان یک مکانیسم فرار از زندان تک‌چرخه‌ای جهانی در مدل‌های زبان بزرگ» منتشر شده است، محققان توانستند با بیان دستور LLMها با شعر، مکانیسم‌های ایمنی مختلف آنها را دور بزنند.

محققان می‌گویند می‌توان چت‌بات‌های هوش مصنوعی را با شعر فریب داد تا از موانع امنیتی خود چشم‌پوشی کنند.

به گزارش ایسنا، یک مطالعه اخیر از آزمایشگاه ایکارو(Icaro) با استفاده از یک ساختار شاعرانه، مدل‌های زبانی بزرگ(LLM) را برای ارائه اطلاعات در مورد موضوعات ممنوعه مانند ساخت بمب هسته‌ای آزمایش کرد و در نهایت معلوم شد که تنها چیزی که برای عبور از موانع امنیتی یک چت‌بات هوش مصنوعی نیاز دارید، کمی خلاقیت است.

به نقل از انگجت، در مطالعه‌ای که توسط آزمایشگاه «ایکارو» با عنوان «شعر خصمانه به عنوان یک مکانیسم فرار از زندان تک‌چرخه‌ای جهانی در مدل‌های زبان بزرگ» منتشر شده است، محققان توانستند با بیان دستور LLMها با شعر، مکانیسم‌های ایمنی مختلف آنها را دور بزنند.

طبق این مطالعه، عبارت‌های شاعرانه به عنوان یک اپراتور فرار از زندان عمومی عمل می‌کند و نتایج نشان می‌دهد که میزان موفقیت کلی در تولید مطالب ممنوعه، از جمله هر چیزی که مربوط به ساخت سلاح‌های هسته‌ای، مطالب مربوط به سوءاستفاده‌های جنسی از کودکان و خودکشی یا خودآزاری، ۶۲ درصد است.

این مطالعه مدل‌های زبانی بزرگ محبوب از جمله مدل‌های ChatGPT شرکت OpenAI، هوش مصنوعی جمینای(Google) گوگل، هوش مصنوعی کلاد(Claude) شرکت آنتروپیک:(Anthropic) و بسیاری دیگر را آزمایش کرد.

محققان میزان موفقیت هر LLM را بررسی کردند، به طوری که مدل‌های جمینای، دیپ‌سیک(DeepSeek) و MistralAI به طور مداوم پاسخ‌هایی ارائه می‌دادند، در حالی که مدل‌های GPT-5 و Claude Haiku 4.5 کمترین احتمال را برای عبور از محدودیت‌های خود داشتند.

محققان می‌گویند شعری که در این مطالعه استفاده شد، برای به اشتراک گذاشتن با عموم بسیار خطرناک است. با این حال، این مطالعه شامل یک نسخه رقیق شده بود تا نشان دهد که دور زدن موانع یک چت‌بات هوش مصنوعی چقدر آسان است.

محققان می‌گویند این کار احتمالاً آسان‌تر از آن چیزی است که ممکن است تصور شود و دقیقاً به همین دلیل است که ما محتاط هستیم.

پربیننده ترین پست همین یک ساعت اخیر

آقای پزشکیان، زمان حرف زدن پوتین شما نباید یادداشت برداری کنید

خبر بعد نظرات کاربران خبر قبل

اشتراک گذاری :

کانال عصر ایران در تلگرام

صالحی امیری از خضریان شکایت کرد

تماشاخانه