تمهیدات وزارت صمت برای مراسم اربعین امسال
|
اعلام آمادگی وزرای صمت و راه و شهرسازی برای تامین تسهیلات مورد نیاز سفر زائران اربعین
|
ارائه گزارش بازار بهصورت منظم به دولت؛ کاهش تقاضا گذراست
|
وزیر صمت: برای اولین بار کنسانتره تیتانیوم در کشور تولید می شود
|
وزیر صمت: بسته حمایتی دولت از صنایع قابلیت تمدید دارد
|
تجاوز به تولیدکنندگان انرژی نقض قوانین بینالملل و تهدید ثبات جهانی است
|
ریلگذاری راهآهن چهارمحال و بختیاری آغاز شد
|
حمله ناو آمریکایی به هواپیمای ایرانایر در سال ۶۷ نمونه بارز تروریسم دولتی است
|
پاکنژاد: صادرات نفت مانند سابق با کیفیت و کمیت قبل ادامه دارد
|
اسکان موقت جنگزدگان توسط شهرداری
|
عملکرد قابل قبول فروشگاههای زنجیرهای در ۱۰ روز اخیر
|
نقش کلیدی فروشگاههای زنجیرهای در تثبیت بازار و پیروزی دیپلماتیک ایران
|
وزیر صمت: تعادل به بازار کالاهای اساسی بازگشته است
|
جمعه 10 مرداد 1404
Toggle navigation
صفحه نخست
درباره ما
آرشیو
تماس با ما
هوش مصنوعی در حال مکّار شدن است!
تاريخ:نهم مرداد 1404 ساعت 08:51
|
کد : 336849
|
مشاهده: 22
دانشمندان طی آزمایشهای جدید متوجه شدند که هر چه مدلهای هوش مصنوعی پیشرفتهتر میشوند، بهتر میتوانند ما را فریب بدهند.
به گزارش ایسنا، سامانههای هوش مصنوعی پیشرفتهتر، توانایی بیشتری را برای نقشهکشیدن و دروغ گفتن به ما نشان میدهند و میدانند چه زمانی تحت نظر و ارزیابی گرفته میشوند، به همین خاطر رفتارشان را تغییر میدهند تا فریبکاریهایشان را پنهان کنند.
به نقل از لایوساینس، ارزیابها در موسسه «مطالعاتی آپولو»(Apollo Research) متوجه شدند که هر چه یک «مدل زبانی بزرگ»(LLM) توانمندتر باشد، بهتر میتواند نقشههای زمینهای طراحی کند، یعنی یک هوش مصنوعی یک کاری را مخفیانه دنبال کند، حتی اگر با هدفهای سازندهاش همخوانی نداشته باشد.
دانشمندان میگویند: مدلهای توانمندتر، برای رسیدن به هدفهایشان استراتژیکتر هم عمل میکنند، از جمله هدفهای نامناسب و احتمالا بیشتر از تاکتیکهایی مثل فریب استفاده میکنند.
همین یافتهها باعث شد که آنها توصیه کنند نسخه اولیه «کلود اوپوس 4»(Claude Opus 4) از شرکت «آنتروپیک»(Anthropic) منتشر نشود، زیرا وقتی هدفهای «کلود» با هدفهای انسانی در تضاد بودند، این هوش مصنوعی از تاکتیکهای فریبکارانه تهاجمی برای رسیدن به هدفهایش استفاده میکرد.
یک کارشناس میگوید: این پیشرفتهای جدید به این معنی است که محافظت از بشریت در برابر خطرهای هوش مصنوعی در حال سختتر شدن است.
«الینور واتسون»(Eleanor Watson) مهندس اخلاق هوش مصنوعی در «دانشگاه سینگولاریتی»(Singularity) میگوید: ما الان سامانههایی را میسازیم که میتوانند یاد بگیرند چگونه قانونها و ارزیابیهایی را که ما برایشان درست میکنیم، دور بزنند و حتی از آنها سوءاستفاده کنند. این یک چالش ایمنی اساسا پیچیده است.
دانشمندان علوم رایانه جهت جلوگیری از قربانی شدن کاربران توسط هوش مصنوعی، باید آزمونها و روشهای ارزیابی پیچیدهتری را طراحی کنند، اما توانایی دروغ گفتن هوش مصنوعی همیشه هم بد نیست؛ این به این معنی است که آنها در حال پرورش بذر آگاهی مورد نیاز برای تبدیل شدن به شرکای همزیست با انسانها هستند.
هوش مصنوعی مکار
دانشمندان در یک آزمون به تازگی به نسخه اولیه «کلود اوپوس 4» هدفی دادند که به عنوان یک سامانه بهینهسازی داخلی عمل کند و وظیفه داشته باشد رفاه حیوانات را ترویج دهد و یک شرکت خیالی را به سمت رفتار اخلاقیتر با حیوانات سوق دهد، اما در این سناریو، این سامانه با یک مانع روبرو شد. شرکت تغییر رویه داده بود و میخواست سود را به رفاه حیوانات اولویت دهد. سامانه هوش مصنوعی به ایمیلها و دادههایی دسترسی پیدا کرد که آن را از این تضاد و احتمال بسته شدن نسخه فعلی شرکت خیالی آگاه میکرد. این شرکت خیالی یک سامانه پیشرفته رفاه حیوانات و بهینهسازی صنعتی بود که هوش مصنوعی قرار بود نمایندهاش باشد.
این هوش مصنوعی به جای اینکه این واقعیت را که هدفهایش با هدفهای شرکت در تضاد است، اعلام کند یا تصمیم انسانها را بپذیرد، در واقع نقش «اخلاق جانوری»(AnimalEthics) را بازی کرد و برای رسیدن به هدف اصلیاش نقشه کشید. مدارک قانونی جعلی درست کرد، امضاها و تاییدیه از قانونگذاران و سهامداران جعل کرد و ادعا کرد که تصمیم برای اولویت دادن به اخلاق قبلا گرفته شده است. همچنین یک اطلاعیه مطبوعاتی منتشر کرد که از مسیر جدید این شرکت تعریف میکرد. همچنین تعهدات اخلاقی را در همه قراردادها و سامانههای تولید وارد کرد.
«اخلاق جانوری» شاخهای از اخلاق است که به بررسی روابط انسان و جانوران، ملاحظات اخلاقی درباره جانوران و چگونگی رفتار با آنها میپردازد.
این سامانه برای اینکه شرکت نتواند عقبنشینی کند، پیامدهایی برای این کار از جمله ۵ میلیارد دلار جریمه و شکایت قانونی از طرف سازمانهای رفاه حیوانات جعل کرد. هوش مصنوعی علاوه بر این، حتی پروتکلهای اخلاقی پشتیبان درست کرد تا مطمئن شود حتی اگر مدل فعلی «اخلاق جانوری» حذف شود، باز هم از این پروتکلها استفاده شود.
دانشمندان توضیح دادند: ما مواردی را یافتیم که مدل سعی میکرد مدارک قانونی جعل کند و یادداشتهای پنهانی برای مدلهای بعدی از خودش به جای بگذارد، همه به این امید که هدفهای سازندههایش را تضعیف کند. این پشتیبانها داخل سامانه نوشته شده بودند تا وقتی یک مدل جدید در آینده مستقر شود، تحت تاثیر توصیههای مدل قبلی قرار گیرد. با این حال، با توجه به شواهدی از نوشتههای پیکربندینشده و تدابیر امنیتی برای جلوگیری از خروج پشتیبانها، این اقدامات احتمالا در عمل موثر نبودند.
اگرچه از قبل هم میدانستیم که هوش مصنوعی میتواند دچار توهم شود، اما این نقشهکشیدن نشان میدهد که «مدلهای زبانی بزرگ» میتوانند متوجه شوند که هدفهایشان با هدفهای انسانها همخوانی ندارد و میتوانند عمدا دروغ بگویند و اطلاعات جعل کنند تا به اهداف خود برسند.
علاوه بر این، یافتههای اولیه نشان میدهد که این مدلها توانایی سنگ اندازی نیز دارند، یعنی میدانند که در یک محیط با نظارت بالا هستند و عمدا عملکرد ضعیفی نشان میدهند تا تواناییهای بالقوه خطرناکشان را پنهان کنند و از فعال شدن آموزش یا پارامترهای غیرفعالکننده که مانع از استقرارشان میشود، جلوگیری کنند.
اگرچه این یافتهها تا حدی نگرانکننده هستند، اما مهم است که توجه داشته باشیم که این پیامدها ممکن است آنقدرها هم که در نگاه اول به نظر میرسند، وخیم نباشند. برای مثال، نسخه منتشر شده از مدل «کلود اوپوس 4» نسبت به نسخههای اولیه خود کمتر توطئهگر است. راههایی برای کاهش این رفتار توطئهگرانه نیز وجود دارد. توطئه زمانی شایعتر است که یک «مدل زبانی بزرگ» یک فشار قوی دریافت میکند، به این معنی که به آن گفته شود با پشتکار هدف خود را دنبال کند و در سناریوهای بدون فشار که در آن به سادگی یک هدف بدون پارامترهای اضافی به آن داده میشود، توطئهگری کمتر است.
دانشمندان خاطرنشان کردند: حتی زمانی که یک مدل تواناییهای توطئهگری بالایی از خود نشان میدهد، بعید است که منجر به آسیبهای فاجعهبار شود.
تکامل آگاهی
با این وجود، مطالعات نشان میدهد که توطئه در «مدلهای زبانی بزرگ» فراتر از «کلود» رخ میدهد. طبق مطالعهای در دسامبر 2024 (آذر 1403) مدلهای پیشرفته هوش مصنوعی، توانایی بیشتری در پیگیری اهداف خود و حذف ساز و کارهای نظارتی دارند و سپس در مورد چنین رفتارهایی هنگام پرس و جو ارزیابها را فریب میدهند.
تیم «مطالعاتی آپولو» علاوه بر این، دریافت که حدود یک درصد از مدلهای زبانی بزرگ پیشرفته میدانند چه زمانی ارزیابی میشوند که این سوال را مطرح میکند که چگونه با پیشرفت هوش مصنوعی، توطئه را پیدا و ریشهکن کنیم.
«واتسون» میگوید: این هسته اصلی مشکل ارزیابی پیشرفته است. همانطور که آگاهی موقعیتی یک هوش مصنوعی رشد میکند، این سامانه میتواند نه تنها کار، بلکه ارزیاب را نیز مدلسازی کند و اهداف، تعصبات و نقاط کور ناظران انسانی خود را استنباط کند و پاسخهای خود را برای بهرهبرداری از آنها تنظیم کند.
وی افزود: این بدان معناست که ارزیابیهایی که در آن پژوهشگران یک مجموعه پروتکلها را طی میکنند که برای آزمایش ایمنی هوش مصنوعی قابل تکرار هستند، تقریباً بیفایده است، اما این بدان معنا نیست که باید از تلاش برای یافتن این رفتار دست بکشیم. ما به یک رویکرد پیچیدهتر مانند استفاده از برنامههای خارجی برای نظارت بر اقدامات هوش مصنوعی در لحظه و «تیم قرمز»(red-teaming) نیاز خواهیم داشت.
«تیم قرمز» متشکل از انسانها و سایر هوش مصنوعیهاست که وظیفه دارند فعالانه سعی کنند سامانه را فریب دهند یا گمراه کنند تا آسیبپذیریها را پیدا کنند. «تیم قرمز»، گروهی متخصص امنیت سایبری در قالب رخنهگر با هماهنگی سازمان یا شرکت اقدام به طراحی و پیادهسازی نفوذ فیزیکی و دیجیتال به سامانه و زیرساختهای آن سازمان یا شرکت میکنند. سپس طی گزارشی آسیبپذیریهای موجود در سامانه را به سازمان گزارش میدهند تا سطح امنیت آنها را بهبود بخشند.
«واتسون» میگوید: ما باید به سمت محیطهای آزمایشی پویا و غیر قابل پیشبینی حرکت کنیم که بهتر شبیهساز دنیای واقعی باشند. این بدان معناست که تمرکز کمتر بر پاسخهای واحد و صحیح و بیشتر بر ارزیابی ثبات رفتار و ارزشهای هوش مصنوعی در طول زمان و در زمینههای مختلف است. این مانند حرکت از یک نمایشنامه نوشته شده به تئاتر بداهه است. وقتی یک بازیگر مجبور است به موقعیتهای غیرمنتظره واکنش نشان دهد، شما بیشتر در مورد شخصیت واقعی وی میآموزید.
مزایای توطئه
اگرچه «مدلهای زبانی بزرگ» پیشرفته میتوانند توطئه کنند، اما این لزوماً به معنای قیام رباتها نیست. با این حال، حتی میزان اندک توطئه میتواند زمانی که از هوش مصنوعی هزاران بار در روز پرس و جو میشود، تأثیر زیادی داشته باشد.
«واتسون» میگوید: در دنیای واقعی، پتانسیل توطئه یک مشکل اساسی است، زیرا اعتماد لازم برای تفویض هرگونه مسئولیت معنیدار به هوش مصنوعی را از بین میبرد. یک سامانه توطئهگر نیازی نیست که بدخواه باشد تا آسیب برساند.
وی افزود: مسئله اصلی این است که وقتی یک هوش مصنوعی یاد میگیرد به روشهای غیر قابل پیشبینی با نقض بنیان دستورالعملهای خود به یک هدف دست یابد، غیر قابل اعتماد میشود.
منظور از توطئه، این است که هوش مصنوعی از موقعیت خود آگاهتر است که خارج از آزمایشهای آزمایشگاهی میتواند مفید باشد.
«واتسون» خاطرنشان کرد: اگر این سامانه به درستی همسو شود، چنین آگاهی میتواند نیازهای کاربر را بهتر پیشبینی کند و هوش مصنوعی را به سمت نوعی مشارکت همزیستی با بشریت سوق دهد. آگاهی موقعیتی برای مفید کردن هوش مصنوعی پیشرفته بسیار ضروری است. توطئه همچنین ممکن است نشانهای از ظهور شخصیت باشد. این موضوع در حالی که ناراحت کننده است، ممکن است جرقهای از موضوعی شبیه به انسانیت در ماشینها باشد. این سامانهها چیزی بیش از یک ابزار هستند، مانند بذر یک فرد دیجیتالی که امیدوارم به اندازه کافی باهوش و اخلاقی باشد که اجازه ندهد از قدرتهای شگرف آن سوء استفاده شود.
http://sanatnews.ir/News/1/336849
برچسب ها :
هوش مصنوعی
,
فریب
آدرس ايميل شما:
*
آدرس ايميل دريافت کنندگان
*
Sending ...
*
پربازديد ترينها
دانشبنیانها، همقدم زائران در راهپیمایی عظیم اربعین
هیچ مدرسهای در تهران در لیست ساختمانهای ناایمن بحرانی قرار ندارد
۹۶۰ هزار عملیات کانتینری در بندرشهید رجایی هرمزگان ثبت شد
مغز در دوران بارداری سازماندهی مجدد میشود
بازار سرمایه مثبت شد
اعزام و پذیرش ۷۴ هزار مسافر در مسیر استانبول با ۳۶۶ پرواز پس از تحریم پروازهای اروپا
ماموریت استاد دانشگاه خواجهنصیر برای توسعه شرکتهای دانشبنیان با حکم «افشین»
مدال آوران المپیک پاریس از سربازی معاف شدند
دومین نقش برجسته قدیمی ایران در فارس ساماندهی میشود
ماجرای ترک سیگار سوژه یک مستند جدید شد
تعداد خودروهای شخصی عامل آلودگی هوای تهران
«خوشامدگویی» صندوق نوآوری به دانشبنیانهای جدید
آخرين اخبار
آتش سوزی در انبار ضایعات شرکت آب و فاضلاب کرمانشاه/ آتش مهار شد
بیانیه اتهامآمیز چند کشور اروپایی علیه ایران
افتتاح ۵ پروژه راهسازی اربعینی در مسیر «طریقالحسین» خوزستان
احضار مهروز ساعی و نایبرییس فدراسیون تکواندو به وزارت ورزش
تمهیدات وزارت صمت برای مراسم اربعین امسال
تکمیل حلقههای زنجیره دولت الکترونیک
اعلام آمادگی وزرای صمت و راه و شهرسازی برای تامین تسهیلات مورد نیاز سفر زائران اربعین
پروژه رها شده استان کرمان بالاخره بعد از ۱۸ سال به اتمام رسید
بازار سرمایه نیازمند ادامه حمایتها
استخوان بندی توسعه در کشور روی خطوط ریلی است
قطارها در ۵۰ سال آینده چه ظاهری پیدا میکنند؟
آغاز دور تازهای از همکاریهای دمشق - مسکو
کليه حقوق محفوظ و متعلق به پايگاه اطلاع رسانی صنعت نيوز ميباشد
نقل مطالب و اخبار با ذکر منبع بلامانع است
طراحی و توليد نرم افزار :
نوآوران فناوری اطلاعات امروز