91在线视频播放_欧美日韩精品一区二区_2020国产成人精品免费视频_国产嫩草影院

您的位置:首頁 >公益 > 正文

靈御(PandaGuard) 人工智能大模型安全攻防評(píng)估平臺(tái)正式發(fā)布:人工智能北京力量護(hù)航人工智能安全穩(wěn)健發(fā)展

人工智能大語言模型在各個(gè)領(lǐng)域的廣泛應(yīng)用從內(nèi)容創(chuàng)作、客戶服務(wù)到教育和軟件開發(fā),這些模型的變革潛力日益凸顯。確保其安全性、魯棒性已成為一個(gè)至關(guān)重要的問題。特別是"越獄攻擊"通過精心設(shè)計(jì)的提示詞繞過安全約束并引發(fā)有害、偏見或不道德輸出的對(duì)抗性攻擊,已經(jīng)成為大語言模型安全領(lǐng)域的系統(tǒng)性和嚴(yán)峻的挑戰(zhàn)。

北京前瞻人工智能安全與治理研究院、人工智能安全與超級(jí)對(duì)齊北京市重點(diǎn)實(shí)驗(yàn)室、中國(guó)科學(xué)院自動(dòng)化研究所人工智能倫理與治理中心聯(lián)合團(tuán)隊(duì)正式發(fā)布靈御(PandaGuard)大模型安全攻防評(píng)估平臺(tái),該平臺(tái)創(chuàng)新性地采用多智能體系統(tǒng)建模方法對(duì)越獄攻擊進(jìn)行系統(tǒng)性評(píng)估。該框架在現(xiàn)有研究基礎(chǔ)上實(shí)現(xiàn)了重要突破,為構(gòu)建安全可控的人工智能生態(tài)提供了重要保障。

6月5日,2025全球數(shù)字經(jīng)濟(jì)大會(huì)(GDEC2025)數(shù)字安全主論壇暨2025北京網(wǎng)絡(luò)安全大會(huì)(BCS2025)召開,前瞻研究院院長(zhǎng)、北京市重點(diǎn)實(shí)驗(yàn)室主任曾毅受邀發(fā)表主旨演講,介紹靈御平臺(tái)及從人工智能安全到安全人工智能的發(fā)展戰(zhàn)略。

靈御(PandaGuard)平臺(tái)通過將大語言模型越獄安全概念化為多智能體系統(tǒng)來解決這些挑戰(zhàn)。在這個(gè)系統(tǒng)中,攻擊者、防御者、目標(biāo)模型和安全判斷器相互作用。框架抽象并模塊化了每個(gè)組件,支持即插即用的實(shí)驗(yàn),包含19種攻擊算法、12種防御機(jī)制和多種判斷策略,對(duì)49個(gè)開源和閉源大語言模型安全性進(jìn)行了系統(tǒng)化評(píng)估。靈御平臺(tái)的這種設(shè)計(jì)促進(jìn)了可控的、可重現(xiàn)的評(píng)估,并使得能夠?qū)δP桶踩械目缃M件權(quán)衡進(jìn)行深度分析。平臺(tái)實(shí)踐證明,世界上提出的所有安全護(hù)欄沒有一個(gè)可以防護(hù)住所有的攻擊算法,也沒有一個(gè)攻擊算法可以突破所有的安全護(hù)欄。在人工智能安全防護(hù)領(lǐng)域還有很長(zhǎng)的路要走。

研究發(fā)現(xiàn),不同時(shí)間發(fā)布的人工智能大模型并沒有隨著模型能力的提升而同時(shí)獲得模型的安全性,近期發(fā)布的國(guó)內(nèi)外能力更強(qiáng)大的人工智能模型安全性并沒有展現(xiàn)出顯著的優(yōu)勢(shì)。一些較新的模型在某些安全指標(biāo)上可能不如早期版本,這揭示了一個(gè)重要事實(shí):安全性能的提升需要專門的優(yōu)化投入,而不是模型能力提高的自然副產(chǎn)品。我國(guó)的人工智能大模型安全性方面總體處于中等水平,特別是針對(duì)很多新近發(fā)布的大模型,針對(duì)越獄攻擊等方面的安全性上還有較大提升空間。曾毅院長(zhǎng)說:現(xiàn)在國(guó)內(nèi)外沒有一個(gè)絕對(duì)安全的人工智能大模型,但通過類似靈御平臺(tái)這樣的AI安全護(hù)欄加固,每一個(gè)大模型都可以做到更安全。

秉承開放合作的理念,靈御人工智能安全攻防平臺(tái)的核心框架已開源開放,研究團(tuán)隊(duì)發(fā)布了完整的代碼、配置和評(píng)估結(jié)果,以支持大語言模型安全領(lǐng)域的透明和可重現(xiàn)研究。這種開放態(tài)度不僅有助于學(xué)術(shù)界的進(jìn)一步研究,也為產(chǎn)業(yè)界的實(shí)際應(yīng)用提供了便利。

北京前瞻人工智能安全與治理研究院、人工智能安全與超級(jí)對(duì)齊北京市重點(diǎn)實(shí)驗(yàn)室、中國(guó)科學(xué)院自動(dòng)化研究所人工智能倫理與治理中心聯(lián)合團(tuán)隊(duì)希望與產(chǎn)業(yè)界共同打造安全治理生態(tài),將通過政產(chǎn)研協(xié)作的方式繼續(xù)致力于擴(kuò)展靈御人工智能安全攻防評(píng)估平臺(tái)與基準(zhǔn),服務(wù)于產(chǎn)業(yè)、科研與政府在人工智能安全治理領(lǐng)域的需求與應(yīng)用。

在大會(huì)的主旨演講結(jié)束的時(shí)候,曾毅院長(zhǎng)總結(jié)到:“安全與治理是人工智能核心能力,將加速人工智能穩(wěn)健發(fā)展與應(yīng)用。我們的前沿研究表明,如果把安全與模型能力比作魚與熊掌,實(shí)則可以兼得。沒有安全治理框架的人工智能不僅是沒有“剎車”,更是沒有“方向盤”。

免責(zé)聲明:本文不構(gòu)成任何商業(yè)建議,投資有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!本站發(fā)布的圖文一切為分享交流,傳播正能量,此文不保證數(shù)據(jù)的準(zhǔn)確性,內(nèi)容僅供參考

關(guān)鍵詞:

相關(guān)內(nèi)容

熱門資訊

最新圖文

91在线视频播放_欧美日韩精品一区二区_2020国产成人精品免费视频_国产嫩草影院

            黄色三级中文字幕| 亚洲免费av网| 两性午夜免费视频| www.日日操| 久久国产成人精品国产成人亚洲| 精品免费久久久久久久| 日韩不卡的av| 四季av一区二区三区| 黑人粗进入欧美aaaaa| 欧美a在线视频| 无罩大乳的熟妇正在播放| 欧美一级视频在线播放| 日韩 欧美 自拍| 亚欧精品在线视频| 手机av在线免费| www.污污视频| 中文字幕色网站| 日本在线观看视频一区| 成人综合久久网| 999这里有精品| 色乱码一区二区三区在线| 国产一二三区av| 污版视频在线观看| 在线观看国产一级片| 波多结衣在线观看| 久草福利视频在线| 毛片毛片毛片毛片毛片毛片毛片毛片毛片| 日本精品一区二区三区四区| 日韩免费毛片视频| 激情六月丁香婷婷| 亚洲乱码国产一区三区| 欧美性猛交xxx乱久交| 亚洲综合欧美激情| 中文字幕1234区| 裸体大乳女做爰69| 亚洲av综合色区| 欧美性潮喷xxxxx免费视频看| 久久精品无码中文字幕| 欧洲精品在线播放| av免费观看大全| 91看片就是不一样| 天天看片天天操| a级网站在线观看| 国产免费一区二区视频| 欧美爱爱视频免费看| 别急慢慢来1978如如2| 手机免费av片| 99亚洲国产精品| 久操网在线观看| 亚洲乱码国产一区三区| 欧美国产在线一区| 欧美成人高潮一二区在线看| 日韩欧美黄色大片| 国产精品久久久久久久av福利| 特级西西444| 成人三级视频在线播放 | 成人av在线播放观看| 亚洲不卡中文字幕无码| 少妇激情一区二区三区| 四虎1515hh.com| 日本欧美视频在线观看| www.欧美日本| 4444在线观看| www.色就是色| 69精品丰满人妻无码视频a片| 激情六月丁香婷婷| 一区二区三区四区免费观看| 久久成人免费观看| 天天综合网久久| 国产自产在线视频| 五月婷婷之婷婷| 无码av天堂一区二区三区| 日韩av一二三四| 亚洲一区 在线播放| 日本va中文字幕| www婷婷av久久久影片| 999在线免费视频| 白白操在线视频| 亚洲欧美自偷自拍另类| 给我免费播放片在线观看| 手机av在线免费| 成人免费观看视频在线观看| 三年中文高清在线观看第6集| 国产男女激情视频| 成人av在线不卡| 亚洲一区精品视频在线观看| 国产成人精品视频免费看| 欧美少妇在线观看| 色婷婷.com| 日本www高清视频| 91成人综合网| 在线免费黄色小视频| av视屏在线播放| 国产va亚洲va在线va| 国产精品嫩草影视| 天天操,天天操| 成人免费在线小视频| 久久久国内精品| а 天堂 在线| 日韩一区二区三区不卡视频| 中文字幕无码精品亚洲35| 大片在线观看网站免费收看| 天天操天天干天天做| 国产麻花豆剧传媒精品mv在线| 欧美这里只有精品| 强开小嫩苞一区二区三区网站 | 香蕉视频免费版| 91av视频免费观看| mm1313亚洲国产精品无码试看| 黄页网站大全在线观看| 欧美乱做爰xxxⅹ久久久| 国产一区一区三区| 1314成人网| 久久婷婷中文字幕| 91小视频在线播放| 一区二区在线免费看| 无码精品国产一区二区三区免费| 亚洲 欧美 日韩 国产综合 在线| 日本一本中文字幕| 91免费国产精品| 粉嫩av一区二区三区天美传媒 | 一区二区免费av| 免费涩涩18网站入口| 蜜臀av午夜一区二区三区| 亚洲熟妇无码另类久久久| 乱子伦一区二区| 一级黄色片播放| 日本丰满大乳奶| 欧美日韩中文字幕在线播放| 日本天堂免费a| 成人国产一区二区三区| 97碰在线视频| 男人添女人荫蒂免费视频| 韩国无码av片在线观看网站| 99在线观看视频免费| 日韩一级片免费视频| 色欲色香天天天综合网www| 男女私大尺度视频| 亚洲欧洲日产国码无码久久99| 啊啊啊一区二区| 老熟妇仑乱视频一区二区| 欧美日韩在线免费播放| 欧美特级aaa| 性久久久久久久久久久久久久| 樱空桃在线播放| 国产乱淫av片杨贵妃| 国产乱子夫妻xx黑人xyx真爽| 丝袜制服一区二区三区| 一级淫片在线观看| 300部国产真实乱| 人妻久久久一区二区三区| 日韩av黄色网址| 中文字幕国产免费| 强伦女教师2:伦理在线观看| 欧美中日韩在线| 激情六月丁香婷婷| 最新天堂在线视频| 黄色小视频大全| 九九九九免费视频| 在线观看免费视频高清游戏推荐| 久久免费看毛片| 人人干视频在线| 日韩一级理论片| 男女爱爱视频网站| 久久久噜噜噜www成人网| 免费一区二区三区在线观看| 国产日韩第一页| 春日野结衣av| www.欧美激情.com| 免费一级特黄毛片| 色婷婷狠狠18| 男人c女人视频| 天天影视综合色| 亚洲精品天堂成人片av在线播放 | 97碰在线视频| jizz欧美激情18| 小泽玛利亚av在线| 成人在线免费播放视频| 日韩 欧美 自拍| 日韩 欧美 高清| 99精品一级欧美片免费播放| 欧美v在线观看| 四虎4hu永久免费入口| www日韩视频| 男女裸体影院高潮| 在线观看亚洲色图| 日本中文字幕网址| 五月天国产视频| 十八禁视频网站在线观看| 永久免费在线看片视频| 成年人免费大片| 黄色一级片国产| av在线网址导航| 欧美黄色免费影院| 国产精品8888| 特黄视频免费观看| 成人黄色片视频| 台湾无码一区二区| 久国产精品视频| 乱子伦视频在线看|