Product Center
产品中心
联系我们
传真:85322966
QQ:1559436599 1048038402
电邮:bbk100@126.com
地址:东莞市长安镇沙头358省道998号巨峰科技园
pg电子模拟器 com:CNCC2025举行《智能体发展与安全(2025)》《大模型生成内容安全与评测()》成果发布
在中国计算机大会(CNCC2025)期间,第一届大模型生成内容安全评估与智能体安全论坛于10月25日在哈尔滨举行。
由哈尔滨工业大学联合上海交通大学等多家高校、科研院所、有名的公司联合编写的《智能体发展与安全(2025)》《大模型生成内容安全与评测(2025)》在论坛上发布。此外,还发布了大模型安全漏洞库及AI安全开源社区,并倡议全球参与“大模型安全合规开源生态”建设。哈尔滨工业大学网络空间安全学院院长姜伟发布上述成果,现场10余位网络安全、人工智能安全领域的院士、知名专家学者,聚焦大模型与智能体发展与安全,深度交流对话,共谋生成式人工智能技术新发展,共商大模型生成内容安全新合作,共建人工智能安全治理新格局,共享智能体安全发展新机遇。
《智能体发展与安全(2025)》《大模型生成内容安全与评测(2025)》发布
《智能体发展与安全(2025)》是业内首份系统性分析智能体发展与安全的研究报告。报告系统梳理了智能体定义及关键技术路线,总结了智能体发展成就,分析了智能体安全风险分类、技术应对措施、综合治理措施,提出了智能体安全风险模型和治理框架,为全球智能体发展与安全提供思想借鉴和智力支撑。
报告首次构建了全栈体系与分层结构的智能体安全风险模型,从感知、决策、记忆、执行四个环节识别潜在风险,以系统化视角揭示了风险在系统内部的耦合与放大效应、作用机制和演化路径。同时,报告提出“政策法规+技术防护+多主体协同”三位一体的治理框架,形成了可落地、可评估、可迭代的系统性防护方案。
针对人工智能行为体(AIA)安全,报告介绍了一种创新性防控技术。为应对具备移动能力、不可解释决策以及潜在自主目标制定能力的AIA可能引发的失控风险,预先构建行之有效的防控体系至关重要。方滨兴院士创新性地提出了“人工智能行为体保险箍”(以下简称“AI保险箍”)的技术。该技术的核心要义在于,于AIA的“大脑”(决策系统)与“四肢”(驱动装置)之间,强制性地嵌入一个独立的、拥有优先控制权的硬件安全模块,该模块包括基本功能、增强功能、安全机制、安全围栏,一旦满足特定条件就会被激活,开始限制AI系统行为,以此来实现对AIA行为的最终控制权。推进AI保险箍的落地实施,是确保人工智能技术在加快速度进行发展进程中,其安全轨迹始终与人类根本利益保持契合的基础性工作。
此外,报告还提出了智能体安全发展的4项对策建议:一是强化智能体发展与安全顶层设计,前瞻性布局与系统性推进;二是构建国家级能力验证与安全评测平台,推动风险监测与验证体系标准化;三是完善智能体安全治理的人才体系与教育体系,提升安全治理能力供给;四是加强国际标准与评测互认合作,提升我国在全球AI安全治理中的话语权与影响力。
报告以“安全、可靠、可控”为核心目标,系统构建了大模型生成内容的安全风险分类体系与多维评测指标体系,从“有害信息风险、虚假信息风险、提示攻击风险、隐私泄露风险、版权侵权风险”等五个维度出发,提出涵盖模型设计、训练、应用与监管的全链条评测框架。
报告首次建立了面向全生命周期的安全可信评测体系,包括风险识别、动态测试、红队对抗、行为对齐和水印溯源等关键环节,形成从输入到输出、从模型到生态的闭环评测机制。同时,结合国家人工智能安全治理政策,提出“技术评测—风险防控—政策支撑”三位一体的体系化解决方案。
该报告的发布,旨在为行业提供科学、统一、可操作的安全评测标准,助力构建开放、透明、可追溯的生成式人工智能生态,为国家在算法安全监管、模型可信评估、行业合规发展提供坚实的技术支撑与制度依据;标志着我国在大模型安全理论、技术与治理体系方面迈出了关键步伐,也为推动AI产业安全、健康、可持续发展奠定了坚实基础。
哈尔滨工业大学和上海交通大学联合研究团队持续打造以开源社区、公开漏洞库、大模型靶场、大模型测评为核心支柱的“大模型安全开源生态”,实现从认知到实践、从能力到标准的闭环。
论坛现场,国内首个大模型安全漏洞库及AI安全开源社区真正开始启动运行,并呼吁全球从业者加入“大模型安全开源生态”,以开源凝聚力量,以实战锻造韧性,共同构筑大模型未来的安全堡垒,推动大模型生态安全协同的可持续创新。
哈尔滨工业大学网络空间安全学院院长姜伟教授表示,AI是新一轮科技革命和产业变革的重要驱动力量,日益成为全世界科技竞争的战略制高点。人工智能的安全、可靠、可控发展关乎国家安全、社会稳定、文化繁荣和国际竞争力提升。《智能体发展与安全(2025)》《大模型生成内容安全与评测(2025)》的发布,是对时代之问的积极响应,研究团队将聚焦人工智能安全领域发展前沿和最新趋势,持续推出大模型生成内容安全与评测、智能体安全等重要研究成果,努力为我国网络强国、数字中国建设建言献策、提供技术和智力支撑。
与会专家一致认为,上述成果不仅为行业提供了技术指引,更为构建安全、可靠、可控的人工智能生态体系奠定了坚实基础;既是我国人工智能发展与安全研究的重要阶段性成果,也是推动全球AI安全治理体系建设的中国方案与中国贡献。(记者 李政葳)
2024年3月13日河北省廊坊市燕郊镇地铁燕郊站至神威大街站区间盾构施工全套工艺流程中发生爆燃事故此次事故共造成7人死亡、27人受伤近日河北省应急管理厅在官网发布这起爆燃事故的调查报告报告数据显示本起事故直接原因是廊坊燕郊地铁项目盾构施工作业时造成临近天然气管道破损导致大量天然气泄漏扩散至涉
今年发生在山西长治的这场邻里血案,一开始大家都以为是因为狗咬人,凶手一时冲动才下的狠手。根据《潇湘晨报》11月13日的报道,今年1月30日下午,山西长治市,一起原本可通过调解解决的邻里纠纷,在晚间失控升级,最终酿成一死三伤的血案。
#出动5.8万人+300架飞机,日本自卫队密集军演 配合高市早苗?央视军事评论员:有很强指向性挑衅性 #高市早苗
这是河南省新乡市封丘县后荆乡村的水泥路 一天什么也不干光拉车了 给人急死#泥巴路 #上热搜
超级国际大都市魅力新广州,亚洲第一省会,广州塔小蛮腰,珠江新城#最美城市夜景广州#欢迎来到广州
文/齐然 编辑/漆菲近一段时间,俄军在东南方向的战场上收获重大成果——连续拉锯了数月后,俄军的小分队终于进入乌东重要枢纽城镇波克罗夫斯克,在城内和乌军展开巷战。随着俄军加大打击后勤线,城内乌军面临被合围的局面。11月初,俄方发布的视频显示,俄军小分队正在进入波克罗夫斯克市中心。
婚宴散席后回收喝剩茅台,主家多次追要在酒店窗帘后找到3箱,酒店否认服务员藏匿,双方已报案
备下近100瓶茅台酒,婚宴散席后主家追要喝剩的喜酒,酒店方仅返还3个空酒瓶,后从宴会厅靠近传菜间的窗帘后面找到 3箱。主家认为是酒店服务员藏匿,酒店方予以否认,双方争执不下均报警处理。
国务院批复同意郑州新郑综合保税区扩区,成为中部地区首个成功扩区的综合保税区
据悉,国务院日前已正式批复,同意郑州新郑综合保税区扩区,成为中部地区首个成功扩区的综合保税区。2010年10月24日,国务院批复设立新郑综保区,是全国第13个综合保税区,也是中部六省首家综合保税区。
洛阳要下雪了,雨夹雪或中到大雪!河南发布寒潮预警,高海拔山区局部暴雪!注意防范!洛阳最新天气预报根据最新气象资料分析,受强冷空气影响,15日夜里至18日我市将先后出现大风雨雪强降温天气。15日夜里至17日,全市有西北风4到5级,阵风8到10级。

服务热线: