“今年,西藏定日縣地震后,一張AI生成的圖片在社交平臺上獲得數萬次轉發,虛假圖片會影響到救災資源的分配,這是人工智能帶來的風險。”近日,在杭州舉辦的一場人工智能主題大會上,浙江大學濱江研究院的青年科學家韓蒙,向人們闡述AI安全領域的重要性,“我們希望對AI生成內容的導向和真實性等進行管理,發現并降低風險。可以理解為,我們想成為AI的守護者,或者說體檢醫生。”
用兩大系統給AI“治病”
AI越來越聰明,但也要保證它生成的內容是安全、合規的。為此,韓蒙團隊研發了“君合”“君盾”兩套系統。
前者有點像“上醫治未病”,在AI部署到具體場景前,通過檢測找出AI存在的問題;后者像人體的免疫系統,在AI開展應用時,識別外來病毒的攻擊。韓蒙說:“‘君合’的檢測項目很豐富,找漏洞的能力也精準。”
對于“君盾”系統,韓蒙打了個比方:“我們設置了‘雙層玻璃’,其中一層用于阻隔惡意提問。”比如,有人會向AI“請教”怎么鉆法律的空子,這層玻璃就能像免疫系統識別外來病毒一樣阻隔掉它,并提醒用戶重新提問。
“雙層玻璃”是一個雙保險。有些惡意問題比較隱蔽,第一層玻璃未能攔截,它會被AI接收,第二層玻璃會對AI生成的答案進行識別,如果包含違法信息,則會及時攔截,不把回答反饋給提問者。
目前,“君合”“君盾”兩個系統是韓蒙團隊的核心產品。他們從2021年開始研發,不斷接入各類AI,開展測試、防護,并與時俱進地對系統迭代升級。
今年DeepSeek爆火后,千行百業陸續接入DeepSeek。韓蒙團隊發現DeepSeek也有不足,比如在進入專業領域時就有不智能的時候。今年3月,韓蒙團隊發布了“君合”“君盾”的最新版本,希望成為更多AI的醫生和健康管家,幫助AI健康、合規發展。
“杭州對我來說,是理想的創業之地”
“這是一個既能做科研,又能開展成果轉化的地方。”浙江大學濱江研究院于2020年成立,2021年,韓蒙加入其中,“我在美國博士畢業后,由于研究方向有非常強的落地性,我對于創業充滿期待。”
浙江大學濱江研究院的科研人員既能獲得杭州市、濱江區提供的支持,也能聯動起浙江大學的學術資源。依托該院成立的杭州君同未來科技有限責任公司是浙江大學濱江研究院的學術成果轉化、產業落地的重要載體。韓蒙是該院的數智融合研究中心主任,還擔任企業的負責人,推動產學研一體化。
就杭州這座城市來說,數字經濟發達,數字化程度高,也為AI發展提供了很好的土壤。“發展人工智能需要開放的生態,在杭州,我們可以和很多人工智能企業思想碰撞、互相教育,進而提升產品質量。”
良好的創新生態催生出更多成果。目前,公司已在人工智能領域獲得了大量專利,團隊的技術創新成果陸續服務于工信部、公安部、中國人民銀行等政府部門及國家金融科技測評中心、浙江省電子信息檢驗檢測研究院、阿里巴巴集團等大型企事業單位、互聯網頭部企業,釋放著可觀的社會經濟效益。
“杭州對我來說,是理想的創業之地,我希望在這里發揮自己的技術積累,幫助人工智能安全、可信地發展。”談及未來,韓蒙將目光停留在墻上的愿景,那是團隊的共同目標——助力人類基礎腦力勞動可信替代。
AI,韓蒙