專家解讀｜從標(biāo)識到鑒偽：AI生成合成內(nèi)容治理的技術(shù)防線與社會共治

發(fā)布時間：2025-03-19 14:29 分享到：

隨著大模型等生成式人工智能技術(shù)的快速發(fā)展，生成內(nèi)容質(zhì)量顯著提升、生成速度明顯加快、適用場景大幅擴(kuò)展，人工智能產(chǎn)業(yè)走深向?qū)?，逐步進(jìn)入了規(guī)?；瘧?yīng)用階段。生成合成技術(shù)開始呈現(xiàn)工具化和普及化趨勢，普通人都可以輕松地接觸到各種生成合成工具。與此同時，各種安全問題也隨之顯現(xiàn)，譬如用AI生成虛假信息、AI換臉明星直播帶貨、AI實時換臉詐騙等違規(guī)甚至違法的事件頻發(fā)。

為規(guī)范人工智能技術(shù)服務(wù)應(yīng)用，維護(hù)國家安全和社會公共利益，國家互聯(lián)網(wǎng)信息辦公室會同多部門發(fā)布的《人工智能生成合成內(nèi)容標(biāo)識辦法》（以下簡稱《標(biāo)識辦法》），秉持兼容并蓄的理念，通過技術(shù)手段管理技術(shù)問題，探索科學(xué)高效的治理手段。

一、人工智能走深向?qū)?，安全治理進(jìn)入“深水區(qū)”

近期隨著人工智能應(yīng)用技術(shù)里程碑式的突破，生成式人工智能應(yīng)用呈現(xiàn)爆炸式增長，同時也出現(xiàn)了各類AI技術(shù)濫用現(xiàn)象頻發(fā)。兩會期間多名代表、委員提交議案和提案呼吁，要對AI生成內(nèi)容進(jìn)行規(guī)范和治理，人工智能安全治理已從危害探討進(jìn)入到實際執(zhí)法的深水區(qū)。

一是生成合成內(nèi)容質(zhì)量顯著提升，普通民眾難以辨識真?zhèn)巍?/strong>當(dāng)前大模型能夠生成高真實感的文本、人像、場景、音頻，普通民眾不借助檢測工具已經(jīng)很難辨別內(nèi)容真?zhèn)巍?strong>二是生成合成數(shù)據(jù)規(guī)?？焖僭鲩L，傳統(tǒng)安全治理體系面臨挑戰(zhàn)。隨著生成式人工智能技術(shù)在各個行業(yè)落地應(yīng)用，生成合成內(nèi)容的數(shù)據(jù)規(guī)?？焖僭鲩L，對生成內(nèi)容進(jìn)行全面檢測成本太高，需要技術(shù)和政策結(jié)合才能實現(xiàn)高效治理。三是生成合成內(nèi)容適用場景大幅擴(kuò)展，助長欺騙場景多樣化。由于技術(shù)成熟程度的局限，以前的偽造內(nèi)容主要針對人臉區(qū)域。隨著生成技術(shù)的突破，已經(jīng)可以實現(xiàn)高逼真的場景和動作生成，以及換臉變聲視頻的實時生成，各種新型的詐騙場景讓民眾防不勝防，急需出臺相關(guān)的治理辦法。

二、《標(biāo)識辦法》開拓主動防御、全民共治的新局面

《標(biāo)識辦法》從內(nèi)容標(biāo)識的關(guān)鍵環(huán)節(jié)入手，以主動防御、行業(yè)自主的方式構(gòu)建全流程的規(guī)范要求，有效應(yīng)對炮制虛假信息等誤用、濫用生成合成技術(shù)的行為。

一是制作平臺主動標(biāo)識。《標(biāo)識辦法》要求提供人工智能生成合成內(nèi)容制作服務(wù)的服務(wù)提供者在其制作內(nèi)容中添加不影響用戶使用的隱式標(biāo)識，并在可能導(dǎo)致公眾混淆或者誤認(rèn)的生成合成內(nèi)容的合理位置、區(qū)域添加顯式標(biāo)識。在生成合成內(nèi)容制作源頭進(jìn)行提醒提示。二是傳播平臺主動檢測。《標(biāo)識辦法》明確提供網(wǎng)絡(luò)信息內(nèi)容傳播服務(wù)的服務(wù)提供者，主動核驗待發(fā)布文件元數(shù)據(jù)中是否含有隱式標(biāo)識，判斷用戶的聲明內(nèi)容，采用技術(shù)手段檢測發(fā)布內(nèi)容中是否包含顯式標(biāo)識或其他生成合成痕跡，并采取適當(dāng)措施在發(fā)布內(nèi)容周邊添加顯著的提示標(biāo)識，在生成合成內(nèi)容傳播路徑進(jìn)行提醒提示。三是應(yīng)用程序分發(fā)平臺主動核驗。《標(biāo)識辦法》第七條要求互聯(lián)網(wǎng)應(yīng)用程序分發(fā)平臺在應(yīng)用程序上架或上線時，核驗提供人工智能生成合成服務(wù)應(yīng)用程序的標(biāo)識相關(guān)材料，在應(yīng)用程序分發(fā)階段落實標(biāo)識管理要求。四是網(wǎng)民用戶主動聲明。《標(biāo)識辦法》第十條要求用戶在發(fā)布信息內(nèi)容時，主動聲明發(fā)布內(nèi)容的生成合成屬性，并使用服務(wù)提供者提供的標(biāo)識功能添加必要的內(nèi)容標(biāo)識，在生成合成內(nèi)容的發(fā)布階段進(jìn)行規(guī)范要求。

三、《標(biāo)識辦法》推動鑒偽技術(shù)與時俱進(jìn)、對抗升級

《標(biāo)識辦法》提出了明確的標(biāo)識管理要求，標(biāo)識數(shù)據(jù)可為鑒偽模型提供豐富多樣、來源廣泛的高質(zhì)量訓(xùn)練樣本，從而推動鑒偽技術(shù)與時俱進(jìn)地迭代升級，及時適應(yīng)人工智能技術(shù)的高速發(fā)展進(jìn)步。

一是加快數(shù)據(jù)層面的生態(tài)閉環(huán)。《標(biāo)識辦法》聯(lián)動標(biāo)識技術(shù)規(guī)范與鑒偽治理手段，一方面高質(zhì)量的訓(xùn)練數(shù)據(jù)可以顯著提高鑒偽模型的能力和效果，另一方面，多樣化的帶標(biāo)業(yè)務(wù)場景可以全面驗證鑒偽系統(tǒng)能力，從而實現(xiàn)數(shù)據(jù)層面“生成-標(biāo)識-檢測”的生態(tài)閉環(huán)，進(jìn)一步推動基座化偽造檢測能力的構(gòu)建。二是促成多模態(tài)鑒偽的功能躍遷。《標(biāo)識辦法》明確了文本、圖片、音頻、視頻等多種模態(tài)的標(biāo)識方法，顯著提升用戶對各模態(tài)生成內(nèi)容感知能力的同時，也為多模態(tài)鑒偽提供了視覺錨點，加速了高質(zhì)量多模態(tài)數(shù)據(jù)集構(gòu)建。通過多模態(tài)特征對齊、動態(tài)對抗訓(xùn)練等技術(shù)方法，進(jìn)一步提高了多模態(tài)內(nèi)容的鑒偽能力，增強(qiáng)鑒偽能力的泛化性和適用性。三是推動偽造溯源的技術(shù)突破。元數(shù)據(jù)隱式標(biāo)識中的平臺編碼與內(nèi)容編號構(gòu)成溯源鏈路，支持通過元數(shù)據(jù)快速定位違規(guī)內(nèi)容來源，助力偽造溯源技術(shù)的能力突破，從而實現(xiàn)更加精準(zhǔn)地檢測識別和技術(shù)應(yīng)對。

四、深度配套標(biāo)識實施，建議加快鑒偽能力推廣普及

面對人工智能生成合成技術(shù)不當(dāng)應(yīng)用導(dǎo)致的內(nèi)容安全風(fēng)險，《標(biāo)識辦法》構(gòu)筑了全面深入的管理陣地。同時還應(yīng)該配套打造與時俱進(jìn)的鑒偽技術(shù)防線，融合運用管理手段和技術(shù)應(yīng)對，協(xié)同推進(jìn)行業(yè)自律和全民監(jiān)督的社會治理體系。

一是構(gòu)建基座化鑒偽底座模型，提升泛化適用性能。大模型生成技術(shù)迭代更新很快，平均兩個月就會出現(xiàn)新的里程碑模型，提升針對新生偽造方法的泛化能力至關(guān)重要，需要摒棄“來一個打一槍”的事后思維，構(gòu)建AI鑒偽底座模型，加強(qiáng)鑒偽模型的泛化適用性能，以大模型對抗大模型。二是研究精準(zhǔn)化對抗鑒偽技術(shù)，防范惡意逃避風(fēng)險。針對金融詐騙、虛假信息等強(qiáng)對抗、高風(fēng)險犯罪，造假者會通過內(nèi)容壓縮、隱蔽投毒等各種手段逃避標(biāo)識義務(wù)和偽造檢測，這就需要在施加對抗意圖和手段的條件下保證高精度專項檢測能力，針對性地提升檢測效果。三是降低對無害生成內(nèi)容傳播的影響，兼顧生成內(nèi)容應(yīng)用的發(fā)展與治理。從技術(shù)層面來說，正向應(yīng)用和違法犯罪應(yīng)用依賴的算法、模型本質(zhì)上沒有區(qū)別，因此需要從大量無害生成內(nèi)容中精準(zhǔn)識別有害偽造內(nèi)容，保障無害內(nèi)容正常傳播的權(quán)利。四是打造全民化偽造檢測工具，推動人人可用鑒偽。全民監(jiān)督的社會共治，要加大科普力度，提高民眾對生成式人工智能的認(rèn)識，同時向民眾提供易用的鑒偽服務(wù)，為普通用戶在身份驗證、信息鑒定等日常生活場景中及時發(fā)現(xiàn)偽造內(nèi)容提供便利，形成全民共治管理效能，全面保障公民隱私和財產(chǎn)安全。

作者：曹娟　中國科學(xué)院計算技術(shù)研究所數(shù)字內(nèi)容合成與偽造檢測實驗室主任，研究員

(來源："網(wǎng)信中國”)

(鏈接：https://mp.weixin.qq.com/s/ETHwYg-XGodAx9-08NoePg）

午夜人妻久久久久久久久,国产国拍精品亚洲A片男同,天天做天天爱天天综合网2021 ,国产精品免费_区二区三区观看

專家解讀｜從標(biāo)識到鑒偽：AI生成合成內(nèi)容治理的技術(shù)防線與社會共治