近日,由中國互聯(lián)網(wǎng)協(xié)會主辦,中國信息通信研究院承辦,云計算標準和開源推進委員會、北京市通信與互聯(lián)網(wǎng)協(xié)會聯(lián)合協(xié)辦的2025“人工智能+”產(chǎn)業(yè)生態(tài)大會“人工智能與安全論壇”在北京順利召開。會上,“大模型安全防護圍欄能力檢驗”評估結果正式發(fā)布,360數(shù)字安全集團憑借扎實的技術積累與全面的服務能力,成為首家通過測評并獲證的企業(yè),標志著其在大模型安全防護方面持續(xù)走在行業(yè)前列。

隨著大模型技術加速落地應用,傳統(tǒng)單點防御機制已難以應對其全生命周期的復雜安全挑戰(zhàn)。為系統(tǒng)化解此類風險,大模型安全防護圍欄應運而生,構建覆蓋“全鏈路貫通、多維度協(xié)同、全周期管控”的一體化防護體系,為大模型安全建設提供了全新路徑。為規(guī)范并推動相關產(chǎn)品能力發(fā)展,中國信通院牽頭制定了《大模型安全防護圍欄產(chǎn)品能力要求》標準,并啟動能力評估工作。
360大模型衛(wèi)士防護系統(tǒng)在本次測評中表現(xiàn)突出,全面滿足基礎管理、風險識別與攔截、智能代答與引導、對抗攻擊防御、管理與運營、系統(tǒng)測試加固等六類指標的能力要求,在行業(yè)內(nèi)首家獲頒大模型安全防護圍欄能力檢驗證書。
面對AI大模型發(fā)展面臨的安全挑戰(zhàn),360創(chuàng)新性提出“外筑‘以模治模’動態(tài)屏障,內(nèi)固‘平臺原生’安全底座”的核心理念。基于豐富實戰(zhàn)經(jīng)驗,提供了可落地的安全解決方案,為大模型應用拉起了全鏈路安全防線,助力推動人工智能行業(yè)向“安全、向善、可信、可控”的方向穩(wěn)健發(fā)展。
作為這套解決方案的重要組成,360大模型衛(wèi)士防護系統(tǒng)聚焦內(nèi)容安全,兼具“內(nèi)容測評”與“內(nèi)容護欄”雙重核心能力。系統(tǒng)基于“以模護?!薄耙詼y促防”的設計理念,提供智能判定機制、風險內(nèi)容檢測、敏感問題代答、內(nèi)容安全測評等關鍵技術,全面保障大模型輸入輸出內(nèi)容的安全性及價值觀對齊。該系統(tǒng)的核心優(yōu)勢包括:
全周期防護體系:基于“以模治模”理念構建多智能體系統(tǒng),覆蓋大模型從訓練、接入、運行到評估的全流程防控,形成完整的安全閉環(huán); 海量高質(zhì)數(shù)據(jù):依托動態(tài)更新的敏感詞庫與百萬級測評數(shù)據(jù),實現(xiàn)風險精準識別與快速響應,持續(xù)提升評測準確率與覆蓋度;豐富實戰(zhàn)驗證:已在政務、金融、能源、互聯(lián)網(wǎng)等多個行業(yè)落地應用,服務重大活動保障與日常運維,能夠迅速響應各類場景下的個性化安全需求。
此次360首家通過信通院大模型安全防護圍欄能力測評,不僅是對其技術實力與產(chǎn)品成熟度的權威認可,也彰顯了其在AI安全領域的持續(xù)積累與前瞻布局。未來,360將持續(xù)深耕大模型安全技術,攜手行業(yè)伙伴共建可信AI生態(tài),為人工智能的穩(wěn)健發(fā)展筑牢安全底座。
(審核編輯: 朝言)
分享