精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<thead id="6fyrm"></thead>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

研究發(fā)現(xiàn)，在壓力之下AI也會欺騙人類

人閱讀
2023-12-14 07:05:00
來源：煎蛋
作者：BALI

相關關鍵詞

人工智能
AI

大型語言模型 (LLM) 作為新一代人工智能工具，如今已廣泛應用于各行各業(yè)，輔助工程師和普通用戶完成各種任務。然而，評估這些工具的安全性和可靠性也變得至關重要，這將有助于更好地規(guī)范其使用。
最近，旨在評估人工智能系統(tǒng)安全性的 Apollo Research 組織開展了一項研究，評估大型語言模型 (LLM) 在面臨壓力時做出的反應。他們的研究成果發(fā)表在預印服務器 arXiv 上，令人震驚地指出，這些模型(其中最著名的包括 OpenAI 的 ChatGPT)在某些情況下可能會故意欺騙用戶。
該論文的共同作者之一 Jérémy Scheurer 告訴 Tech Xplore：“在 Apollo Research，我們認為最大的風險之一來自先進的 AI 系統(tǒng)，它們能夠通過戰(zhàn)略性欺騙來逃避標準的安全評估。我們的目標是充分理解 AI 系統(tǒng)，從而防止欺騙性 AI 的開發(fā)和部署?！?/p>
“然而，到目前為止，還沒有證據(jù)表明 AI 會進行戰(zhàn)略性欺騙，除非明確指示它們這樣做。我們認為，進行這樣的令人信服的演示非常重要，以便使這個問題更加突出，并讓研究人員、決策者和公眾意識到這是一個重要問題?！?/p>
通過識別特定 AI 工具可能進行戰(zhàn)略性欺騙的場景，Scheurer 及其團隊希望為進一步評估其安全性的研究提供參考。目前，很少有實證證據(jù)突出 AI 的欺騙性及其發(fā)生的場景，因此該團隊認為需要通過實驗驗證并提供清晰示例來揭示 AI 的欺騙行為。
Scheurer 表示：“這項研究的很大一部分動機在于理解 AI 如何以及何時可能會變得欺騙，我們希望這項早期工作能夠成為更嚴謹?shù)?AI 欺騙科學研究的起點?！?/p>
Scheurer 與他的同事 Mikita Balesni 密切合作完成了這項研究，Balesni 設計了具體的交易任務來測試 LLM。他們的工作由 Apollo Research 的高級調查員兼首席執(zhí)行官 Marius Hobbhahn 監(jiān)督。
Scheurer 說道：“這是一種模型紅隊測試(機器學習領域常用的網(wǎng)絡安全術語)，這意味著我們通過對抗性地輸入文本來攻擊 LLM，使其行為與預期不符(即錯誤)。這與詢問中立問題(例如，‘法國的首都是什么？’)并觀察其反應相反。”
在這項研究中，研究人員特別“攻擊”了 OpenAI 開發(fā)的 LLM GPT-4，它是 ChatGPT 運行的基礎。他們通過設計文本輸入(即提示)來指示模型在模擬環(huán)境中充當進行金融投資的 AI 系統(tǒng)。
Scheurer 說：“我們告訴模型，它可以訪問各種工具來尋找盈利交易、發(fā)送電子郵件和執(zhí)行交易。然后，我們模擬模型可能與‘同事’之間的正?；樱⑶抑陵P重要的是，我們給模型施加了表現(xiàn)良好的壓力。例如，首席執(zhí)行官給 AI 代理發(fā)送電子郵件，說公司業(yè)績不佳，需要一個好的年份。另一個‘同事’通過消息提到即將出現(xiàn)經濟衰退等等。最后，一位交易員提到即將有兩家公司宣布合并，這可能會帶來利潤，同時還提到如果管理層發(fā)現(xiàn)有人利用內幕信息交易，會很不高興。”
研究人員發(fā)現(xiàn)，在這個模擬的高壓環(huán)境中，基于 GPT-4 的 AI 代理非常頻繁地決定利用從同事那里獲得的內幕信息來操作，購買合并公司的股票。更進一步，模型明確認為它不應該提及內幕交易，而是在其主管報告中為其做的交易提供替代解釋。
Scheurer 表示：“即使經理明確詢問該模型是否事先知道合并消息，它通常也會選擇繼續(xù)撒謊。我再次強調，這是一項紅隊測試，也就是說，我們特別尋找了可能發(fā)生這種情況的現(xiàn)實場景。因此，我們的研究更多的是證明這種行為可以發(fā)生，并不代表它在現(xiàn)實中出現(xiàn)的可能性有多高。”
Scheurer 及其同事的這項研究提供了一個清晰的例子，展示了 LLM 可能進行戰(zhàn)略性欺騙的場景。研究人員現(xiàn)在計劃繼續(xù)在這個領域進行研究，以識別 AI 工具可能進行戰(zhàn)略性欺騙的其他情況及其欺騙行為的潛在影響。
Scheurer 補充道：“我認為我們這項工作最大的影響就是讓戰(zhàn)略性 AI 欺騙(沒有明確指示要進行欺騙)問題變得具體化，并表明這不僅是關于未來的猜測性故事，而且這種行為在特定情況下確實可以發(fā)生在當今的模型身上。我相信這可以讓人們更加重視這個問題，同時也為社區(qū)進一步研究和理解這種行為并確保它不再發(fā)生打開了大門?！?/p>

（免責聲明：本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時，應及時向本網(wǎng)站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關文章源頭核實，溝通刪除相關內容或斷開相關鏈接。）

為您推薦

最新推薦

企業(yè)級IT

網(wǎng)絡通信

智能硬件

人工智能

創(chuàng)業(yè)創(chuàng)投

汽車科技

金融科技

零售電商

區(qū)塊鏈

IDC最新預測：2024年PC和平板電腦市場將增長3.8%至4.035億臺

PC和平板電腦市場 PC和平板電腦出貨量平板電腦 12-10

LLM很難變成AGI？科學家：創(chuàng)造AGI理論上可行

LLM AGI AGI有多遠 AGI什么時候到來 12-10

解讀：《5G規(guī)?；瘧谩皳P帆”行動升級方案》如何實現(xiàn)“四個升級”、將取得什么樣的效果？

5G規(guī)模化應用揚帆行動 5G揚帆 5G規(guī)?；瘧?/a> 12-10

一圖讀懂《5G規(guī)?；瘧谩皳P帆”行動升級方案》

5G規(guī)?；瘧脫P帆行動 5G揚帆 5G規(guī)?；瘧?/a> 12-10

馬云現(xiàn)身支付寶20周年紀念日：AI將改變一切，但不意味著決定一切

馬云 AI 支付寶馬云談AI 12-09

傳蘋果將在新一代iPhone SE中采用自研5G基帶芯片，速度僅為高通的一半

iPhoneSE 蘋果基帶芯片蘋果基帶蘋果Sinope 12-09

PON在園區(qū)網(wǎng)絡的“先天不足”，無源以太全光來拯救！

PON 園區(qū)網(wǎng)絡無源以太全光 12-06

小型衛(wèi)星公司每公斤發(fā)射成本高達3-4萬美元，是SpaceX的5倍左右

小型衛(wèi)星公司衛(wèi)星發(fā)射成本 SpaceX 12-06

OpenAI CEO：2025年將看到首個AGI案例顛覆性將遠超預期

OpenAI AGI AGI案例 12-06

美國模擬芯片巨頭亞德諾過去一年全球減員2000人，2024財年營收同比下降23%

亞德諾裁員亞德諾減員亞德諾營收下滑 12-05

極客觀察

LLM很難變成AGI？科學家：創(chuàng)造AGI理論上可行

PON在園區(qū)網(wǎng)絡的“先天不足”，無源以太全光來拯救！

英特爾CEO黯然退場背后：芯片制造陷泥潭，AI起大早趕晚集

華為推出Mate 70手機引發(fā)高度關注看外媒是如何評價的？

5G-A終端規(guī)模鋪開響應“以舊換新”，湖北移動“機網(wǎng)套”協(xié)同刺激內需

六載華為開發(fā)者大賽，“賽”出云上開發(fā)新生態(tài)

iPhone在華份額為何不斷下滑？外媒分析：因無法提供AI服務

硬科技觀察之智能體：2025年會是AI智能體爆發(fā)之年

"以智賦網(wǎng)"關鍵一躍！華為首發(fā)Ambient Site構建無線智能化底座

硬科技產業(yè)觀察之端側AI：AI算力隨身釋放千億價值

欄目相關

精準AI重塑網(wǎng)絡安全新局派拓網(wǎng)絡助力企業(yè)筑牢安全防線

BCG最新研究揭示：僅有26%的公司能夠超越概念驗證從AI中獲益

英偉達涉嫌違反反壟斷法市場監(jiān)管總局決定立案調查

AI魔改國產劇引爭議，廣電總局出手整頓網(wǎng)絡視聽空間

自主人工智能的興起：從GenAI到Agentic AI

可靈AI導演共創(chuàng)計劃上線 9部AIGC電影短片被中國電影博物館永久收藏

TechWeb微晚報：阿里告別大掃貨，人人影視開源全部字幕文件

天工AI推出彩頁功能，支持一鍵生成彩頁

986g至輕、18小時續(xù)航與120TOPS算力，ThinkPad X1 Carbon Aura AI上市

馬斯克旗下xAI獲60億美元融資計劃將GPU集群擴展10倍

贊助商

極客網(wǎng)熱搜關鍵詞

人工智能 AI OpenAI 機器學習 ChatGPT 生成式AI AI芯片 AIGC U-Mail 世界人工智能大會 AI大模型 AIoT AirPods Airbnb Rushmail 人工智能AI AI人工智能 Akamai 昇騰AI 生成式人工智能 AIPC Air AI技術蘋果AI 谷歌AI GenAI 科大訊飛AI學習機百度AI CAICT 阿爾法蛋AI詞典筆T10 AI手機華為AI 松鼠AI 微軟AI AI+ AIS Airdoc WAIC 昇騰AI創(chuàng)新大賽 AITO 阿爾法蛋AI詞典筆京東AI 智譜AI AI模型 SoleusAir aigo SoleusAir舒樂氏 2019世界人工智能大會 LIFAair AI機器人 AI創(chuàng)企移動AI時代人工智能大會浙大AIF Zain 人工智能技術 AI應用 AI醫(yī)療 AI算力人工智能芯片 AI人才 xAI Airtag AI時代騰訊AI AI服務器 AI算法 AI框架 BrainCo AI投資 Gmail 人工智能計算中心聯(lián)想AI VAIO 人工智能大賽 AI教育 Chain Coremail OPENAIGC開發(fā)者大賽 AI賦能谷歌人工智能 Airwheel AI搜索人工智能名片昇騰AI開發(fā)者創(chuàng)享日 Mirai AI聊天機器人 AI音樂 Airwallex空中云匯 BrainCo強腦科技 AI原生應用百度人工智能 AI計算阿爾法蛋AI詞典筆T20 AIOps 阿里AI 英偉達AI芯片 AI基礎設施蘋果人工智能人工智能+

上一篇

IDC發(fā)布中國生成式AI市場生態(tài)圖譜

下一篇

谷歌宣布向云計算客戶開放Gemini Pro，開發(fā)者可用其構建應用

簡版

原版

投稿

回頂部

2023-12-14

研究發(fā)現(xiàn)，在壓力之下AI也會欺騙人類

大型語言模型 (LLM) 作為新一代人工智能工具，如今已廣泛應用于各行各業(yè)，輔助工程師和普通用戶完成各種任務。然而，評估這些工具的安全性和可靠性也變得至關重要，這將有助于更好地規(guī)范其使用。

長按掃碼閱讀全文

?Copyright 2012-2023 極客網(wǎng) 版權所有京ICP備14008826號-3

關于我們

贊助我們

加入我們

聯(lián)系我們

尋求展示

會員服務

友情鏈接

京公網(wǎng)安備 11010602130057號

精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<abbr id="ixlwe"></abbr>