报告: 多智能体协同的智能运维方法研究


报告人姓名: 孙永谦 南开大学

报告人简介:南开大学软件学院副教授、博导,南开图书馆副馆长(挂职),CCF高级会员。从事智能运维(AIOps)领域研究,专注于基于LLM、多智能体等方法研究面向多模态数据的故障识别、诊断与预防等,国际会议或期刊发表论文60余篇,获得国际软件可靠性工程旗舰会议ISSRE2024最佳论文和最佳工业论文奖。主持国家重大专项课题、国家自然基金与天津市自然基金等多项项目,与华为、字节跳动、阿里、腾讯、快手等头部IT企业合作校企共研项目20项。获得中国电子学会科技进步一等奖(4/15)、南开大学“良师益友”荣誉称号、教育部-华为智能基座“栋梁之师”等荣誉。

摘要:本次分享聚焦智能运维与故障诊断的前沿实践,从实际问题出发,介绍如何用大模型与多智能体技术处理分布式系统的复杂故障:从海量日志中自动检测异常、精准定位故障根因,并生成工程师可直接理解的推理过程;通过多智能体协同,实现无需大量标注数据的泛化能力,适配不同业务场景;同时用因果建模解决推理中的证据捏造、上下文漂移等难题,让诊断结果更可靠、可解释。研究为大模型时代的企业级系统运维提供高效、智能的新范式。