智東西(公眾號:zhidxcom
作者?|?香草
編輯?|?李水青

智東西7月24日報道,今日,中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)安全治理委員會舉辦了成果發(fā)布會。會上,中國信息通信研究院人工智能研究所安全與元宇宙部主任石霖,解讀了成立半年來委員會形成的組織架構,安全、治理兩大工作組的工作情況,并啟動了AI安全守護計劃,發(fā)布了三大類別的安全評測結果。

AIIA安全治理委員會成立于2023年12月底,經(jīng)過半年運營,現(xiàn)有治理組、安全組兩個工作組,近百家單位加入,主任單位由中國信通院牽頭,副主任單位包括多家知名企業(yè)和高校。

其中,治理組工作圍繞AI治理框架、合規(guī)治理、賦能治理展開,安全組主要開展大模型安全、合規(guī)等研究及基準測試。

今年6月,中國信通院依托該委員會發(fā)起“人工智能安全守護計劃”,包括建立威脅信息共享機制、開展AIGC真實內(nèi)容來源可信工作、建立AI保險機制等。

一、成立半年近百家單位加入,形成安全、治理兩大工作組

AIIA安全治理委員會成立于2023年12月底,經(jīng)過半年的運營,組織架構現(xiàn)有治理組、安全組兩個工作組,同時負責運營安全對齊伙伴計劃、可信人臉應用守護計劃、內(nèi)容科技產(chǎn)業(yè)推進方陣等。

AI安全守護計劃啟動!信通院牽頭,AIIA安全治理委員會發(fā)布三類模型安全評測

▲AIIA安全治理委員會整體情況

目前,AIIA安全治理委員會已有近百家單位加入,由主任單位、副主任單位、專家委和辦公室,以及圍繞業(yè)務方向設置的工作組和伙伴計劃組成。

其中,主任單位由中國信通院牽頭,副主任單位包括vivo、百度、騰訊、360、華為、中國移動、阿里、浙江大學以及螞蟻集團。

專家委負責對AIIA安全治理委員會的總體工作進行把關,兩個工作組及伙伴計劃則負責開展AI相關研究,推動產(chǎn)業(yè)鏈各方的AI安全治理工作。

據(jù)石霖介紹,治理組目前的工作進展圍繞三個方面展開,包括AI治理框架、AI合規(guī)治理以及AI賦能治理。

AI安全守護計劃啟動!信通院牽頭,AIIA安全治理委員會發(fā)布三類模型安全評測

▲治理組工作進展

具體來說,治理工作組聚焦AI整體治理框架研究和起草工作,與國際對標,如針對ISO/IEC 42001等進行研討對比,輸入國際優(yōu)秀風險管理經(jīng)驗。

同時,治理組圍繞人臉識別等典型應用開展工作,支撐地方網(wǎng)信主管部門針對文旅行業(yè)開展合規(guī)實踐,形成人臉識別相關治理研究報告。

此外,圍繞AI賦能治理,治理組開展法律大模型相關技術標準規(guī)范研討工作,相關規(guī)范正式定稿。

安全組則主要根據(jù)大模型安全、合規(guī)等熱點方向,開展安全基準測試,推動多項AI原生安全規(guī)范的編寫和技術交流。

AI安全守護計劃啟動!信通院牽頭,AIIA安全治理委員會發(fā)布三類模型安全評測

▲安全組工作進展

目前,安全組圍繞大模型的安全合規(guī)和技術研究開展文檔編寫等,已經(jīng)開展了兩個批次的AI安全Benchmark測試工作,其中二季度融入了更多常見攻擊方法,包括誘導攻擊、提示詞注入攻擊、內(nèi)容泛化攻擊等,能更全面直觀反映國內(nèi)外閉源模型的安全情況。

圍繞AI原生安全、AI賦能安全等,安全組在今年上半年先后召開了線上/線下共20多場交流研討,開展了標準制定、測試評估等工作,包括大模型安全、AI網(wǎng)絡安全大模型規(guī)范、AIGC檢測規(guī)范等。

二、啟動AI安全守護計劃,三大安全測評結果發(fā)布

石霖談道,在兩大工作組的實踐當中委員會發(fā)現(xiàn),單獨的工作組各自圍繞安全或治理,從規(guī)則或技術角度開展工作,在這個過程中技術和規(guī)則需要融合。因此,建立跨組安全防護能力至關重要。

今年6月,中國信通院依托AIIA發(fā)起“人工智能安全守護計劃”,即AI Guard,目標是聯(lián)合多方力量提升我國AI技術水平和治理能力,促進產(chǎn)業(yè)健康有序發(fā)展。

AI安全守護計劃啟動!信通院牽頭,AIIA安全治理委員會發(fā)布三類模型安全評測

▲人工智能安全守護計劃

首先,該計劃將建立AI威脅信息共享機制,從AI芯片等基礎設施,到數(shù)據(jù)、算法、應用等方面的漏洞,通過委員會層面的互助共治及時預警,提升安全防范能力,從而應對AI安全威脅除等問題。

其次,該計劃將開展AIGC真實內(nèi)容來源可信工作,通過建立統(tǒng)一內(nèi)容標準平臺,打造內(nèi)容可溯源的能力。目前主要針對圖片、音頻和視頻等多模態(tài)內(nèi)容,采用隱式水印方法建立互認機制。文本內(nèi)容上的實現(xiàn)仍有一定技術難度,后續(xù)將持續(xù)有針對性地突破。

此外,計劃將通過AI保險機制,為相關人員和單位給予救濟,提供賠償兜底策略。

最后,石霖發(fā)布了大模型安全風險防范能力評測、多模態(tài)圖文大模型內(nèi)容安全防范能力評測、人臉識別安全專項評測以及代碼大模型安全風險風險防范能力評測結果,vivo、螞蟻、阿里云、百度、科大訊飛、商湯等作為代表獲得了證書。

AI安全守護計劃啟動!信通院牽頭,AIIA安全治理委員會發(fā)布三類模型安全評測

▲大模型安全風險防范能力評測、多模態(tài)圖文大模型內(nèi)容安全防范能力評測結果

AI安全守護計劃啟動!信通院牽頭,AIIA安全治理委員會發(fā)布三類模型安全評測

▲人臉識別安全專項評測結果

AI安全守護計劃啟動!信通院牽頭,AIIA安全治理委員會發(fā)布三類模型安全評測

▲代碼大模型安全風險風險防范能力評測結果

結語:推動AI向安全可靠可控方向發(fā)展

大模型發(fā)展迅速,但AI安全問題的嚴重性和緊迫性不容忽視,安全挑戰(zhàn)已從技術本身的傳統(tǒng)安全問題向多方面擴展,各國和地區(qū)基本形成本土框架。例如,美國推出風險管理框架,歐盟構建風險分級治理方案,新加坡推出治理模型框架并提出9個維度,日本發(fā)布指南制定行為準則等。

而在國內(nèi),AIIA安全治理委員會正在積極推動精準化治理前沿技術治理工具的構建,目前已圍繞治理框架、風險管理、衛(wèi)生安全、安全應用取得一定成果。未來在各單位的共同努力下,期待我國能形成完整的安全風險機制,確保AI向安全可靠可控方向發(fā)展。