隨著大模型等生成式人工智能技術(shù)的快速發(fā)展,生成內(nèi)容質(zhì)量顯著提升、生成速度明顯加快、適用場景大幅擴(kuò)展,人工智能產(chǎn)業(yè)走深向?qū)?,逐步進(jìn)入了規(guī)?;瘧?yīng)用階段。生成合成技術(shù)開始呈現(xiàn)工具化和普及化趨勢,普通人都可以輕松地接觸到各種生成合成工具。與此同時,各種安全問題也隨之顯現(xiàn),譬如用AI生成虛假信息、AI換臉明星直播帶貨、AI實時換臉詐騙等違規(guī)甚至違法的事件頻發(fā)。
為規(guī)范人工智能技術(shù)服務(wù)應(yīng)用,維護(hù)國家安全和社會公共利益,國家互聯(lián)網(wǎng)信息辦公室會同多部門發(fā)布的《人工智能生成合成內(nèi)容標(biāo)識辦法》(以下簡稱《標(biāo)識辦法》),秉持兼容并蓄的理念,通過技術(shù)手段管理技術(shù)問題,探索科學(xué)高效的治理手段。
一、人工智能走深向?qū)?,安全治理進(jìn)入“深水區(qū)”
近期隨著人工智能應(yīng)用技術(shù)里程碑式的突破,生成式人工智能應(yīng)用呈現(xiàn)爆炸式增長,同時也出現(xiàn)了各類AI技術(shù)濫用現(xiàn)象頻發(fā)。兩會期間多名代表、委員提交議案和提案呼吁,要對AI生成內(nèi)容進(jìn)行規(guī)范和治理,人工智能安全治理已從危害探討進(jìn)入到實際執(zhí)法的深水區(qū)。
一是生成合成內(nèi)容質(zhì)量顯著提升,普通民眾難以辨識真?zhèn)巍?/strong>當(dāng)前大模型能夠生成高真實感的文本、人像、場景、音頻,普通民眾不借助檢測工具已經(jīng)很難辨別內(nèi)容真?zhèn)巍?strong>二是生成合成數(shù)據(jù)規(guī)??焖僭鲩L,傳統(tǒng)安全治理體系面臨挑戰(zhàn)。隨著生成式人工智能技術(shù)在各個行業(yè)落地應(yīng)用,生成合成內(nèi)容的數(shù)據(jù)規(guī)??焖僭鲩L,對生成內(nèi)容進(jìn)行全面檢測成本太高,需要技術(shù)和政策結(jié)合才能實現(xiàn)高效治理。三是生成合成內(nèi)容適用場景大幅擴(kuò)展,助長欺騙場景多樣化。由于技術(shù)成熟程度的局限,以前的偽造內(nèi)容主要針對人臉區(qū)域。隨著生成技術(shù)的突破,已經(jīng)可以實現(xiàn)高逼真的場景和動作生成,以及換臉變聲視頻的實時生成,各種新型的詐騙場景讓民眾防不勝防,急需出臺相關(guān)的治理辦法。
二、《標(biāo)識辦法》開拓主動防御、全民共治的新局面
《標(biāo)識辦法》從內(nèi)容標(biāo)識的關(guān)鍵環(huán)節(jié)入手,以主動防御、行業(yè)自主的方式構(gòu)建全流程的規(guī)范要求,有效應(yīng)對炮制虛假信息等誤用、濫用生成合成技術(shù)的行為。
一是制作平臺主動標(biāo)識。《標(biāo)識辦法》要求提供人工智能生成合成內(nèi)容制作服務(wù)的服務(wù)提供者在其制作內(nèi)容中添加不影響用戶使用的隱式標(biāo)識,并在可能導(dǎo)致公眾混淆或者誤認(rèn)的生成合成內(nèi)容的合理位置、區(qū)域添加顯式標(biāo)識。在生成合成內(nèi)容制作源頭進(jìn)行提醒提示。二是傳播平臺主動檢測。《標(biāo)識辦法》明確提供網(wǎng)絡(luò)信息內(nèi)容傳播服務(wù)的服務(wù)提供者,主動核驗待發(fā)布文件元數(shù)據(jù)中是否含有隱式標(biāo)識,判斷用戶的聲明內(nèi)容,采用技術(shù)手段檢測發(fā)布內(nèi)容中是否包含顯式標(biāo)識或其他生成合成痕跡,并采取適當(dāng)措施在發(fā)布內(nèi)容周邊添加顯著的提示標(biāo)識,在生成合成內(nèi)容傳播路徑進(jìn)行提醒提示。三是應(yīng)用程序分發(fā)平臺主動核驗。《標(biāo)識辦法》第七條要求互聯(lián)網(wǎng)應(yīng)用程序分發(fā)平臺在應(yīng)用程序上架或上線時,核驗提供人工智能生成合成服務(wù)應(yīng)用程序的標(biāo)識相關(guān)材料,在應(yīng)用程序分發(fā)階段落實標(biāo)識管理要求。四是網(wǎng)民用戶主動聲明。《標(biāo)識辦法》第十條要求用戶在發(fā)布信息內(nèi)容時,主動聲明發(fā)布內(nèi)容的生成合成屬性,并使用服務(wù)提供者提供的標(biāo)識功能添加必要的內(nèi)容標(biāo)識,在生成合成內(nèi)容的發(fā)布階段進(jìn)行規(guī)范要求。
三、《標(biāo)識辦法》推動鑒偽技術(shù)與時俱進(jìn)、對抗升級
《標(biāo)識辦法》提出了明確的標(biāo)識管理要求,標(biāo)識數(shù)據(jù)可為鑒偽模型提供豐富多樣、來源廣泛的高質(zhì)量訓(xùn)練樣本,從而推動鑒偽技術(shù)與時俱進(jìn)地迭代升級,及時適應(yīng)人工智能技術(shù)的高速發(fā)展進(jìn)步。
一是加快數(shù)據(jù)層面的生態(tài)閉環(huán)。《標(biāo)識辦法》聯(lián)動標(biāo)識技術(shù)規(guī)范與鑒偽治理手段,一方面高質(zhì)量的訓(xùn)練數(shù)據(jù)可以顯著提高鑒偽模型的能力和效果,另一方面,多樣化的帶標(biāo)業(yè)務(wù)場景可以全面驗證鑒偽系統(tǒng)能力,從而實現(xiàn)數(shù)據(jù)層面“生成-標(biāo)識-檢測”的生態(tài)閉環(huán),進(jìn)一步推動基座化偽造檢測能力的構(gòu)建。二是促成多模態(tài)鑒偽的功能躍遷。《標(biāo)識辦法》明確了文本、圖片、音頻、視頻等多種模態(tài)的標(biāo)識方法,顯著提升用戶對各模態(tài)生成內(nèi)容感知能力的同時,也為多模態(tài)鑒偽提供了視覺錨點,加速了高質(zhì)量多模態(tài)數(shù)據(jù)集構(gòu)建。通過多模態(tài)特征對齊、動態(tài)對抗訓(xùn)練等技術(shù)方法,進(jìn)一步提高了多模態(tài)內(nèi)容的鑒偽能力,增強(qiáng)鑒偽能力的泛化性和適用性。三是推動偽造溯源的技術(shù)突破。元數(shù)據(jù)隱式標(biāo)識中的平臺編碼與內(nèi)容編號構(gòu)成溯源鏈路,支持通過元數(shù)據(jù)快速定位違規(guī)內(nèi)容來源,助力偽造溯源技術(shù)的能力突破,從而實現(xiàn)更加精準(zhǔn)地檢測識別和技術(shù)應(yīng)對。
四、深度配套標(biāo)識實施,建議加快鑒偽能力推廣普及
面對人工智能生成合成技術(shù)不當(dāng)應(yīng)用導(dǎo)致的內(nèi)容安全風(fēng)險,《標(biāo)識辦法》構(gòu)筑了全面深入的管理陣地。同時還應(yīng)該配套打造與時俱進(jìn)的鑒偽技術(shù)防線,融合運用管理手段和技術(shù)應(yīng)對,協(xié)同推進(jìn)行業(yè)自律和全民監(jiān)督的社會治理體系。
一是構(gòu)建基座化鑒偽底座模型,提升泛化適用性能。大模型生成技術(shù)迭代更新很快,平均兩個月就會出現(xiàn)新的里程碑模型,提升針對新生偽造方法的泛化能力至關(guān)重要,需要摒棄“來一個打一槍”的事后思維,構(gòu)建AI鑒偽底座模型,加強(qiáng)鑒偽模型的泛化適用性能,以大模型對抗大模型。二是研究精準(zhǔn)化對抗鑒偽技術(shù),防范惡意逃避風(fēng)險。針對金融詐騙、虛假信息等強(qiáng)對抗、高風(fēng)險犯罪,造假者會通過內(nèi)容壓縮、隱蔽投毒等各種手段逃避標(biāo)識義務(wù)和偽造檢測,這就需要在施加對抗意圖和手段的條件下保證高精度專項檢測能力,針對性地提升檢測效果。三是降低對無害生成內(nèi)容傳播的影響,兼顧生成內(nèi)容應(yīng)用的發(fā)展與治理。從技術(shù)層面來說,正向應(yīng)用和違法犯罪應(yīng)用依賴的算法、模型本質(zhì)上沒有區(qū)別,因此需要從大量無害生成內(nèi)容中精準(zhǔn)識別有害偽造內(nèi)容,保障無害內(nèi)容正常傳播的權(quán)利。四是打造全民化偽造檢測工具,推動人人可用鑒偽。全民監(jiān)督的社會共治,要加大科普力度,提高民眾對生成式人工智能的認(rèn)識,同時向民眾提供易用的鑒偽服務(wù),為普通用戶在身份驗證、信息鑒定等日常生活場景中及時發(fā)現(xiàn)偽造內(nèi)容提供便利,形成全民共治管理效能,全面保障公民隱私和財產(chǎn)安全。
作者:曹娟 中國科學(xué)院計算技術(shù)研究所數(shù)字內(nèi)容合成與偽造檢測實驗室主任,研究員
(來源:"網(wǎng)信中國”)
(鏈接:https://mp.weixin.qq.com/s/ETHwYg-XGodAx9-08NoePg)