當前,我國AI大模型的應(yīng)用呈現(xiàn)迅猛增長態(tài)勢。QuestMobile發(fā)布的最新數(shù)據(jù)顯示,DeepSeek上線次月(2025年2月),活躍用戶規(guī)模就突破了1.8億。但在AI應(yīng)用大眾化的同時,也有不少網(wǎng)友驚呼:與AI的蜜月期還沒有結(jié)束,就發(fā)現(xiàn)它在騙我!
有人用AI查資料,發(fā)現(xiàn)AI會編造假論文,期刊名稱、論文標題、作者、網(wǎng)址等信息一應(yīng)俱全,可全是編的;曾有一條“80后死亡率突破5.2%”的假新聞廣為流傳,據(jù)辟謠者分析,最初的信源可能來自AI對話……
這其實不是新問題,而是在大模型誕生之初就存在的老毛病——AI幻覺。甚至有專家認為,AI幻覺是大模型的“基因病”。因為AI大模型訓(xùn)練依賴海量數(shù)據(jù),但數(shù)據(jù)的真實性卻無人擔保。AI大模型訓(xùn)練過程中,是將海量數(shù)據(jù)高度壓縮抽象,輸入的是內(nèi)容之間關(guān)系的數(shù)學(xué)表征,而不是內(nèi)容本身。AI與人類對話時,模型基于統(tǒng)計概率生成文本,追求流暢性而非真實性,很容易編出看似流暢但完全不符合事實的內(nèi)容。
既然AI幻覺是“基因病”,那這病能治嗎?要怎么治?
首先,AI幻覺也帶來了AI的“超能力”,沒必要根除。
AI幻覺也有好的一面。AI自主生成內(nèi)容是大語言模型的突出特點,是最具想象力的技術(shù)突破。作為大模型與生俱來的特點,AI幻覺決定了大模型的創(chuàng)造力,對實現(xiàn)通用人工智能(AGI)非常重要,并可在科研、文藝等領(lǐng)域發(fā)揮作用。
比如,游戲開發(fā)、動漫設(shè)計、小說創(chuàng)作等領(lǐng)域歡迎奇思妙想,AI幻覺可以突破思維定式,為創(chuàng)作提供靈感。再如,科學(xué)研究中往往也需要非常規(guī)思路來破局闖關(guān),AI不走尋常路的創(chuàng)造力,可以推動科研工作出現(xiàn)“AI幻覺—實驗驗證—理論重構(gòu)”的新范式。
其次,AI幻覺雖不可根除,但可以控制。
對于AI幻覺,我們不能放任自流。一方面,AI幻覺產(chǎn)生大量虛假信息,這些虛假信息被新一代AI系統(tǒng)學(xué)習(xí),就會形成“數(shù)據(jù)污染—算法吸收—再污染”的惡性循環(huán)。另一方面,在企業(yè)生產(chǎn)、醫(yī)療、法律等容錯率很低的領(lǐng)域,AI幻覺可是“要命”的大毛病。因此,我們要從技術(shù)研發(fā)和管理機制上雙管齊下,防范AI幻覺信息的泛濫。
技術(shù)層面,檢索增強生成(RAG)技術(shù)、多模型交叉驗證、動態(tài)知識更新機制等,都已被證明是減少AI幻覺的有效手段。未來,還需要繼續(xù)提升訓(xùn)練數(shù)據(jù)質(zhì)量與清洗標準,嚴格檢測數(shù)據(jù)的來源和真實性,減少噪聲干擾;引入強化學(xué)習(xí)與人類反饋機制,提升AI邏輯推理能力;增強AI大模型檢測能力,用AI監(jiān)管AI。
用戶層面,對AI輸出的答案不要直接采信,可以用多個AI模型分別生成答案再交叉驗證、對照取優(yōu),對關(guān)鍵任務(wù)輸出更有必要采取人工交叉驗證,結(jié)合文獻數(shù)據(jù)庫、行業(yè)知識圖譜等專業(yè)工具作出判斷。
監(jiān)管層面,“標注AI生成內(nèi)容”已成為我國監(jiān)管部門推動的方向,這體現(xiàn)了對生成式人工智能的透明度要求,將提高AI生成內(nèi)容的可追溯性和可解釋性。未來,我們還應(yīng)加快人工智能法立法進程,建立全周期全鏈條監(jiān)管體系。
實現(xiàn)“不被AI忽悠”目標,既需要算法工程師構(gòu)建底層安全防線,也需要全社會共同建設(shè)可信AI生態(tài)。期待中國AI產(chǎn)業(yè)解決好這道AI幻覺控制難題,在創(chuàng)造力與真實性之間取得平衡。