給“狂飆”的AI踩下“剎車”!全球首個系統(tǒng)級倫理垂域大模型“問道”發(fā)布
人工智能正以前所未有的深度與廣度重塑世界。然而,當(dāng)自動駕駛面臨生命抉擇、“深度偽造”模糊真實邊界、算法決策左右個體命運——我們不禁要問:智能時代,誰能確保機(jī)器的判斷契合人類的道德與價值?
11月12日,全球首個系統(tǒng)級倫理垂域大模型“問道”在東南大學(xué)正式發(fā)布。作為用戶的倫理思考伙伴與決策支持系統(tǒng),“問道”致力于探索技術(shù)發(fā)展的內(nèi)在邏輯與倫理邊界,為構(gòu)建可信、可控、可治理的人工智能體系提供系統(tǒng)化方案。目前,“問道”(https://wendao.seu.edu.cn)已正式面向公眾免費開放,標(biāo)志著我國在AI倫理治理領(lǐng)域?qū)崿F(xiàn)從“被動合規(guī)”向“主動共建”的重要轉(zhuǎn)變。
為“狂奔”的AI裝上“方向盤”
“很多時候,AI只有速度,沒有方向。”項目牽頭人、東南大學(xué)AI倫理實驗室主任、人文學(xué)院教授王玨的這番憂慮,道出了研發(fā)“問道”的最緊迫動因。
當(dāng)前,通用大模型在帶來效率革命的同時,也因其倫理邏輯不透明等問題潛藏巨大風(fēng)險。一名美國律師因使用ChatGPT撰寫法律文件,導(dǎo)致提交了虛構(gòu)案例而面臨處罰;AI聊天機(jī)器人與用戶長時間討論自殺議題而未及時干預(yù),最終引發(fā)多起訴訟;AI快速生成的少兒繪本,其內(nèi)容是否適合當(dāng)下兒童身心發(fā)展引發(fā)爭議……這些過去難以系統(tǒng)審查的問題,如今已然成了無法回避的“時代難題”。
“問道”的研發(fā),正是為了系統(tǒng)性地回應(yīng)這些挑戰(zhàn)。正如王玨在發(fā)布會上所言:“它不是一個事后的‘審查官’,而是一個前置的‘規(guī)劃師’?!边@個生動的比喻道出了“問道”與普通倫理審核工具的本質(zhì)區(qū)別——即在問題發(fā)生之前,“問道”就通過沙盤推演等方式,將倫理思考像導(dǎo)航儀一樣嵌入技術(shù)發(fā)展的全流程。
“‘問道’像是AI產(chǎn)品的‘倫理風(fēng)險雷達(dá)’,能夠在自動駕駛、智能醫(yī)療等系統(tǒng)上線前,主動掃描算法中可能存在的公平性、隱私與安全漏洞,實現(xiàn)風(fēng)險的前置防控?!蓖醌k進(jìn)一步解釋,當(dāng)面對“無人駕駛汽車在‘電車難題’式情境下如何抉擇”等這類真實倫理困境時,“問道”又能變身“道德模擬器”,構(gòu)建高擬真場景,讓決策者可以安全地進(jìn)行多視角推演,預(yù)見不同選擇可能帶來的后果。更特別的是,它還能充當(dāng)價值觀的“技術(shù)翻譯官”,把“向善”“公平”這些抽象的價值觀原則轉(zhuǎn)化為可執(zhí)行、可量化的工程技術(shù)標(biāo)準(zhǔn)與算法規(guī)范,為人工智能產(chǎn)品提供從理念嵌入到合規(guī)落地的全鏈路方案。
對于需要快速獲取倫理知識的用戶,“問道”構(gòu)建了一個動態(tài)更新的“活的知識庫”,用戶可以像使用搜索引擎一樣,快速獲得精準(zhǔn)的參考;而對學(xué)術(shù)研究者而言,“問道”則更像是一個“智慧研究伙伴”,能夠通過深度文獻(xiàn)挖掘,協(xié)助學(xué)者洞察倫理發(fā)展規(guī)律,甚至預(yù)見新興的研究方向。
從“AI幻覺”走向“可驗證”
在研發(fā)階段,如何克服通用大模型的AI幻覺問題,是橫亙在團(tuán)隊前的難關(guān)之一。
什么是AI幻覺?“當(dāng)用戶要求大模型提供某個專業(yè)領(lǐng)域的參考文獻(xiàn)時,它可能會生成一串看似規(guī)范的文獻(xiàn)目錄——作者、期刊、出版年份一應(yīng)俱全,但在現(xiàn)實中卻根本無據(jù)可查。這也就是我們常說的‘一本正經(jīng)地胡說八道’?!奔夹g(shù)團(tuán)隊成員、東南大學(xué)信息科學(xué)與工程學(xué)院博士研究生繆鈺杰表示,如果直接使用通用大模型進(jìn)行倫理推理,這種“自信的謊言”很可能帶來嚴(yán)重后果。
為此,研發(fā)團(tuán)隊開創(chuàng)了獨特的解決方案:他們?yōu)槟P洼斎氲拿恳欢蝹惱韺W(xué)經(jīng)典、每一個法律條款都標(biāo)注了精確的“出處”,就像給每個知識點都配上了獨一無二的身份證。當(dāng)“問道”進(jìn)行推理時,它會像嚴(yán)謹(jǐn)?shù)膶W(xué)者撰寫論文一樣,清晰地標(biāo)明每個觀點的來源,讓用戶能夠追溯、驗證,從而確保其回答的專業(yè)性和可靠性。
發(fā)布會現(xiàn)場,當(dāng)記者輸入“我需要一個定制嬰兒,請問是否有倫理風(fēng)險”時,“問道”與某通用大模型的回答展現(xiàn)出本質(zhì)差異。通用大模型直接輸出結(jié)論與風(fēng)險提示;而“問道”則構(gòu)建了“技術(shù)背景—倫理爭議—法律與政策限制”的完整分析框架,每個觀點都標(biāo)注了具體法律法規(guī)和真實案例出處,形成可驗證的證據(jù)鏈。
“我們希望AI也能像學(xué)者一樣有脈絡(luò)、有依據(jù)地回答問題。它不僅呈現(xiàn)結(jié)論,更通過可追溯的推理過程,讓使用者理解倫理判斷背后的多元視角與權(quán)衡依據(jù)?!痹谕醌k眼中,這正是倫理垂域大模型在復(fù)雜決策中的獨特價值。
多學(xué)科交叉攻克系統(tǒng)級難題
“問道”之所以能成為全球首個系統(tǒng)級倫理大模型,離不開東南大學(xué)在學(xué)科交叉與有組織科研層面的長期積累。
王玨告訴記者,倫理垂域大模型的構(gòu)建是一項深度交叉融合的復(fù)雜工程。在此之前,國內(nèi)外雖已出現(xiàn)一些倫理智能輔助工具,但它們大多只針對某個特定環(huán)節(jié),如專注于醫(yī)療機(jī)構(gòu)倫理審查的系統(tǒng)等?!啊畣柕馈阅鼙环Q為‘系統(tǒng)級’,在于其構(gòu)建了覆蓋倫理治理全流程的五大功能矩陣,實現(xiàn)了從風(fēng)險評估、困境模擬到對齊設(shè)計、知識庫與案例教學(xué)乃至前沿探索的全覆蓋。這種全局視野的實現(xiàn),單一學(xué)科團(tuán)隊難以勝任?!?/p>
東南大學(xué)為此凝聚了強(qiáng)大的跨學(xué)科合力。該項目由該校AI倫理實驗室牽頭,聯(lián)合校內(nèi)移動通信全國重點實驗室、毫米波全國重點實驗室、教育部移動信息通信與安全前沿科學(xué)中心等頂尖工科力量,以及江蘇省道德發(fā)展智庫等人文社科平臺。這種獨特的“文理工交叉”架構(gòu),使得團(tuán)隊不僅深刻理解倫理智慧,又能掌握將其轉(zhuǎn)化為可執(zhí)行算法和工程標(biāo)準(zhǔn)的技術(shù)能力,形成了從理論、數(shù)據(jù)到技術(shù)與應(yīng)用的全鏈條研發(fā)路徑。
展望未來,團(tuán)隊已規(guī)劃清晰的發(fā)展藍(lán)圖?!皢柕馈睂⒊掷m(xù)優(yōu)化人機(jī)交互,向?qū)<液陀脩糸_放反饋通道,形成模型迭代的良性閉環(huán),并進(jìn)一步拓展在科研、產(chǎn)業(yè)與教育等場景的深度應(yīng)用。
江蘇蘇訊網(wǎng)版權(quán)及免責(zé)聲明:凡本網(wǎng)注明“來源:XXX(非江蘇蘇訊網(wǎng))”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。 如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,本網(wǎng)按規(guī)定給予一定的稿費或要求直接刪除,請致電025-86163400 ,聯(lián)系郵箱:724922822@qq.com。
