Day 53:综合项目 Agent 集成
今天的学习目标是将昨天搭建的后端框架和前天设计的Agent架构结合起来,实现九个专业Agent的完整逻辑和多Agent协作流程。这是整个综合项目技术含量最高的一天——你要让每个Agent都有明确的专业能力、结构化的输出格式和可靠的协作机制,最终让它们像一个高效的咨询团队一样协同工作。
Agent集成的核心挑战不是单个Agent的Prompt写得有多好,而是多个Agent之间如何传递信息、如何处理不一致、如何在某个环节出错时不影响整体流程。一个好的多Agent系统就像一个好的企业组织——每个岗位的人做好自己的专业工作,岗位之间的信息传递清晰高效,出现问题时有人兜底。
一、需求理解Agent:从模糊语言到结构化参数
需求理解Agent是整个流程的入口,它的职责是把用户输入的模糊自然语言转化为其他Agent可以使用的结构化参数。这个Agent的设计质量直接决定了后续所有分析的精准度——如果需求理解错了,后面所有Agent都在错误的方向上努力。
需求理解Agent接收的输入是用户通过前端提交的原始信息:行业文本、企业规模选择、岗位文本、痛点描述文本和可选的上传文档内容。这些输入中存在大量的模糊性和歧义。比如用户输入的行业是”做芯片的”——这究竟是芯片设计还是芯片制造还是芯片封测?用户输入的痛点是”仓库太乱了”——这是库存数据不准确、是仓库空间利用率低、还是拣货效率低?
需求理解Agent需要完成三件事:消除歧义(把模糊的表述精确化)、补充隐含信息(用户没说但可以从行业和岗位推断出的信息)和结构化输出(把自然语言转化为标准的JSON格式)。
消除歧义的方法是在Prompt中要求Agent对每个模糊输入给出最可能的解释并列出备选解释。比如对于”做芯片的”,Agent应该输出”最可能:半导体制造(晶圆代工),备选:半导体设计(Fabless)、半导体封测(OSAT)“。在理想情况下这些歧义应该通过前端交互来消除(Day 52提到的行业智能推荐功能),但作为后端Agent也需要具备独立处理歧义的能力。
补充隐含信息是需求理解Agent最有价值的部分。当用户说”我是做服装制造的,仓库管理很乱”时,Agent不仅需要记录用户说的内容,还需要推断用户没说但很重要的信息。比如服装制造业的仓库管理通常涉及SKU数量多(不同款式、颜色、尺码)、季节性波动大、退换货处理复杂等特点。这些隐含信息不需要用户告诉你,Agent应该基于行业知识自动补充。
结构化输出是需求理解Agent与其他Agent协作的基础。输出格式定义为一个严格的JSON结构,包含以下字段:行业分类(标准化行业名称和层级编码)、企业画像(规模、主营业务、数字化程度)、目标岗位(标准化岗位名称和工作领域)、核心痛点列表(每个痛点包含痛点描述、严重程度评估和影响范围)、分析建议(推荐重点关注的分析方向和优先级)。
需求理解Agent的Prompt设计需要特别强调输出格式的严格遵守。一个常见的失败模式是Agent输出了正确的内容但格式不对——比如把JSON的某个字段写成了中文而不是预定义的英文key,或者嵌套层级多了一层。这种格式错误会导致后续Agent解析失败。在Prompt中需要给出完整的输出格式示例,并用明确的指令要求”严格按照以下格式输出,不要修改任何字段名或结构”。
二、行业研究Agent:深入理解行业全貌
行业研究Agent基于需求理解Agent的结构化参数,结合RAG知识库,生成目标行业的深度分析。这个Agent的职责是建立行业上下文——为后续的岗位拆解和方案设计提供行业级的背景知识。
行业研究Agent的核心能力不是搜索信息,而是”构建叙事”。单纯的信息罗列(这个行业有多大、有多少企业、增长率是多少)对用户来说价值有限,因为这些信息用户自己也能查到。真正有价值的是从AI应用角度构建的行业叙事——这个行业正在经历什么变革、AI在其中扮演什么角色、先行者取得了什么成果、后来者的机会在哪里。
行业研究Agent的输出包含四个部分。第一部分是行业概览,包括行业规模和增长趋势、行业价值链的关键环节、当前面临的核心挑战和行业数字化转型的整体水平。这些信息来自知识库的预置数据和RAG检索的最新资料。
第二部分是行业AI应用图谱。这部分是行业研究Agent最重要的输出——梳理该行业中所有已知的AI应用场景,按照价值链环节进行分类。比如制造业的AI应用图谱可能包含研发设计环节(AI辅助产品设计、材料配方优化)、生产制造环节(质量检测、工艺参数优化、设备预测性维护)、供应链环节(需求预测、库存优化、物流路径规划)、销售服务环节(客户画像、智能推荐、售后服务自动化)。每个应用场景需要标注成熟度(实验阶段、试点阶段、规模化阶段)和典型效果(效率提升百分比、成本降低百分比)。
第三部分是竞争格局分析。描述行业中AI应用的竞争态势——领先者是谁、他们在做什么、与追赶者的差距有多大。这部分信息不需要非常具体(系统无法获取实时的竞争情报),但需要给出方向性的判断。比如”在半导体制造领域,头部企业已经在良品率优化和设备预测性维护方面实现了AI规模化应用,而中小企业在这两个领域仍处于探索阶段,存在明显的效率差距”。
第四部分是行业特定考量。每个行业都有独特的监管要求、数据敏感性和组织文化,这些因素会影响AI方案的可行性。比如医疗行业的AI应用需要考虑数据隐私法规,金融行业需要考虑模型可解释性要求,制造业需要考虑生产环境的安全标准。行业研究Agent需要识别这些特殊因素并在输出中标注,供后续的风险审查Agent使用。
行业研究Agent与RAG知识库的交互方式是两阶段检索。第一阶段用行业名称作为查询词进行粗检索,获取该行业的概览性文档。第二阶段基于第一阶段的检索结果,提取出需要深入了解的具体话题(如”该行业最常见的AI应用场景”),用这些具体话题进行细检索。这种两阶段检索比一次检索更精准——第一阶段建立了行业上下文,第二阶段在这个上下文中深入挖掘。
三、岗位拆解Agent:把工作变成可分析的任务列表
岗位拆解Agent是连接行业分析和AI机会识别的关键桥梁。它的职责是把一个抽象的”岗位”拆解为具体的、可分析的工作任务列表。只有把工作内容拆解到任务颗粒度,才能评估每个任务的AI替代或增强潜力。
岗位拆解Agent的设计哲学是”理解工作的本质而不是罗列工作内容”。一个好的岗位拆解不应该只是列出一堆任务名称,而是要理解每个任务的执行逻辑——这个任务需要什么输入、经过什么处理、产生什么输出、判断标准是什么、出错率最高的环节在哪里。这种深层理解是后续AI机会识别的基础。
岗位拆解Agent的输出是一个层级化的任务树。第一层是岗位职责(如”仓储管理”包含”收货入库”、“库存管理”、“拣货出库”等职责模块)。第二层是具体任务(如”收货入库”包含”核对送货单与采购订单”、“检查物料外观质量”、“录入库存系统”、“安排库位存放”等任务步骤)。第三层是任务细节(如”核对送货单与采购订单”包含”提取送货单上的物料编码和数量”、“在系统中查找对应采购订单”、“比对物料编码、规格和数量”、“标记差异项并通知采购部门”等操作步骤)。
每个任务步骤需要标注以下属性。执行频率(每日/每周/每月/按需)、平均耗时(分钟)、出错率(高/中/低)、知识依赖(需要什么专业知识和经验)、数据依赖(需要什么数据和信息输入)、决策复杂度(简单规则/需要判断/需要经验)和人际协作(是否需要与他人沟通协调)。这些属性的综合评估决定了一个任务的AI替代或增强潜力。
岗位拆解需要特别注意行业的差异性。同样是”仓储管理”这个岗位,在服装制造和半导体制造中的工作内容和AI潜力完全不同。服装制造的仓库管理核心挑战是SKU多、季节性强、退换货频繁,AI可以在库存预测和智能分仓方面发挥作用。半导体制造的仓库管理核心挑战是无尘环境要求、物料追溯精度高、存储条件特殊,AI可以在环境监控和物料追溯自动化方面发挥作用。
岗位拆解Agent的Prompt需要包含足够多的行业岗位知识。纯依赖模型训练数据中的通用知识可能不够——模型可能知道”仓储管理”的一般职责但不知道在特定行业中的特殊要求。这时候RAG知识库中预置的行业岗位数据就派上用场了——在Prompt中注入行业相关的岗位描述和工作流程文档,让Agent基于这些具体资料进行拆解而不是凭空想象。
四、AI机会评分Agent:量化每个AI应用机会的价值
AI机会评分Agent是整个系统中最核心的评估环节。它基于行业研究Agent和岗位拆解Agent的输出,识别所有可能的AI应用机会并进行多维度评分。这个Agent的输出直接决定了报告中的方案推荐排序,所以评分的准确性和公平性至关重要。
AI机会评分Agent的设计核心是评分框架的定义。一个好的评分框架需要覆盖所有影响AI应用可行性和价值的关键维度,同时每个维度的评分标准要清晰可操作。
我们定义五个评分维度,每个维度满分二十分,总分一百分。第一个维度是技术可行性——当前AI技术(包括LLM、计算机视觉、NLP、预测模型等)能否完成这个任务。评分标准:二十分表示已有成熟的商业解决方案可以直接使用,十五分表示技术可行但需要一定的定制开发,十分表示技术上可以实现但效果有限,五分表示技术尚在研究阶段不可靠,零分表示当前技术完全无法实现。
第二个维度是数据基础——目标企业通常是否具备支撑AI应用所需的数据。AI应用离不开数据,如果一个任务根本没有数字化数据支撑,再好的AI技术也无用武之地。评分标准:二十分表示所需数据已经数字化且质量高,十五分表示部分数据已数字化但需要补充,十分表示数据主要在纸质或人脑中需要先数字化,五分表示几乎没有数据需要从零建设,零分表示数据完全不可获取。
第三个维度是商业价值——AI应用后能创造多大的经济效益。评分标准:二十分表示预期年收益超过五十万或效率提升超过百分之五十,十五分表示预期年收益十万到五十万或效率提升百分之二十到五十,十分表示预期年收益五万到十万或效率提升百分之十到二十,五分表示收益有限但有一定改善,零分表示几乎没有可量化的商业价值。
第四个维度是实施难度——落地这个AI方案需要多少资源和多长时间。这个维度是反向评分——难度越低分数越高。评分标准:二十分表示一个月内可上线且不需要专门的IT团队,十五分表示一到三个月可上线且需要基础IT支持,十分表示三到六个月且需要专业开发团队,五分表示六个月以上且需要大量定制开发,零分表示需要整个组织的系统性变革。
第五个维度是组织适配度——企业的团队和文化是否准备好接受这个AI方案。AI方案失败的最常见原因不是技术不行,而是组织没有准备好。评分标准:二十分表示团队有AI基础且领导层支持,十五分表示团队愿意学习但缺乏AI经验,十分表示团队抵触情绪不高但缺乏动力,五分表示团队抵触情绪较强需要变革管理,零分表示组织完全抗拒变化。
AI机会评分Agent的输出是一个评分矩阵,每一行是一个AI应用机会,每一列是一个评分维度。矩阵底部是按总分排序的机会列表。对于每个机会,Agent还需要输出一段评分理由——为什么给了这个分数、主要的加分项和减分项是什么。这些理由是报告中向用户解释评分结果的重要素材。
五、方案设计Agent:从机会到可执行的方案
方案设计Agent选取AI机会评分中排名最高的机会(通常是前两到三个),为每个机会设计具体的AI Agent方案。这是整个系统中创造性最强的Agent——它不是在做评估而是在做设计,需要综合技术可行性、业务需求和成本约束来产出一份可以落地的方案。
方案设计Agent的输出结构包含六个部分。方案概述是方案的核心价值主张——这个方案做什么、解决什么问题、预期实现什么效果。概述应该用业务语言而非技术语言来写,让企业管理者能直接理解。
技术架构描述方案的技术实现方式。包括AI技术选型(用LLM、RAG还是传统机器学习)、数据流设计(数据从哪里来、经过什么处理、到哪里去)、Agent设计(需要几个Agent、各自负责什么、怎么协作)和系统集成方式(如何与现有系统对接)。技术架构需要考虑可扩展性——方案不应该是一次性的,而应该能随着业务发展逐步增强。
Agent流程设计是方案设计Agent最独特的输出。对于涉及多Agent协作的方案,需要画出详细的Agent流程图——哪些Agent按顺序执行、哪些可以并行、中间数据的格式是什么、异常处理逻辑是什么。这个流程图就是Day 50 PRD中提到的Agent流程图的具体化。
实施路径描述方案落地的阶段划分。推荐采用”快速验证到逐步扩展”的渐进式实施策略。第一阶段是一个两到四周的MVP(最小可行产品)——用最简单的技术实现核心功能,验证方案可行性和效果。第二阶段是一个一到两个月的优化迭代——基于MVP的使用反馈优化Agent逻辑和数据质量。第三阶段是一个三到六个月的规模化部署——将验证成功的方案扩展到更多岗位和业务线。
资源需求量化实施方案需要的人力、资金和时间。人力方面需要什么角色(如Prompt工程师、后端开发者、数据工程师、项目经理)、每个人力的投入时间。资金方面包括开发成本、API调用成本、基础设施成本。时间方面包括每个阶段的起止时间和关键里程碑。
方案设计Agent的Prompt需要强调”具体性”和”可操作性”。方案不应该包含”根据实际情况调整”这种模糊表述,而应该给出具体的建议——用哪个模型、数据怎么处理、Agent怎么编排、每阶段做什么。这种具体性让用户觉得”这个方案我可以直接照着做”,而不是”这个方案说了半天我还是不知道怎么做”。
六、ROI Agent与风险审查Agent:量化价值与识别风险
ROI Agent和风险审查Agent是方案设计之后的两个互补的评估Agent。ROI Agent从正面量化方案的经济价值,风险审查Agent从反面识别方案可能遇到的问题。一个完整的方案推荐需要同时展示价值和风险,让用户做出知情决策。
ROI Agent的输出是一个投资回报分析模型。模型包含三个核心部分。第一部分是成本估算,包括一次性投入成本(方案设计费、系统开发费、数据准备费、培训费)和持续运营成本(AI API调用费、系统维护费、数据更新费、人员成本)。成本估算需要区分固定成本和可变成本——API调用费随使用量变化是可变成本,系统维护费是固定成本。
第二部分是收益估算,包括直接收益(人力成本节约、错误率降低带来的返工成本节约、效率提升带来的产能增加)和间接收益(客户满意度提升、决策速度加快、合规风险降低)。直接收益可以量化计算,间接收益需要用合理的假设来估算。ROI Agent需要在输出中清楚标注哪些收益是直接计算的、哪些是基于假设估算的以及假设的依据是什么。
第三部分是投资回报计算,核心指标包括净现值(NPV)、投资回收期(Payback Period)和三年ROI百分比。投资回收期是客户最关心的指标——“我投入的钱多长时间能赚回来”。一般来说,企业对AI项目的投资回收期期望在六到十八个月之间。如果ROI Agent计算的回收期超过两年,方案的吸引力会大幅下降,此时需要在报告中标注”建议缩小范围先做高ROI的子项目”。
风险审查Agent的职责是识别和评估方案实施过程中可能遇到的风险。风险分为四个维度。技术风险包括模型准确率不达标、系统性能瓶颈、数据质量问题和技术依赖风险(如某个模型API突然涨价或停服)。组织风险包括团队抗拒新工具、管理层支持力度不够、关键人员离职和培训效果不达预期。数据风险包括数据不完整、数据质量差、数据隐私合规问题和数据孤岛问题。市场风险包括行业环境变化导致需求变化、竞争对手抢先推出类似方案和技术快速迭代导致方案过时。
风险审查Agent对每个识别到的风险进行两维评估——发生概率(高、中、低)和影响程度(高、中、低),并为每个风险提供应对策略。应对策略分为三类:预防策略(降低风险发生概率)、缓解策略(风险发生时降低影响)和应急方案(风险发生后的恢复措施)。
风险审查Agent的Prompt需要特别强调”诚实”和”建设性”。Agent不应该回避风险——只说好话不说风险是对客户的不负责任。但同时每个风险都必须配上有建设性的应对策略——不能只说”这个方案有数据风险”然后就没有下文了。建设性的风险描述是”这个方案需要大量历史销售数据来训练预测模型,如果数据不完整会影响模型准确率。应对策略:第一阶段先用规则引擎补充,同时启动数据治理项目,三个月后积累足够数据再切换为AI模型”。
七、报告生成Agent:整合碎片为完整叙事
报告生成Agent是整个Agent流程的最后一个环节,它的工作是把前面所有Agent的输出整合为一份连贯的、专业的最终报告。这听起来像是简单的拼接工作,但实际上是最考验设计能力的Agent——它需要在保持各个Agent输出专业性的同时,创造一个统一的叙事线索。
报告生成Agent面对的主要挑战是信息冗余和逻辑矛盾。信息冗余是指多个Agent可能从不同角度提到了相同的信息——行业研究Agent提到了某个行业趋势,岗位拆解Agent在描述工作背景时又提到了,方案设计Agent在设计理由中再次提到了。报告生成Agent需要识别这些冗余并做合并处理——保留最有价值的表述,删除重复内容。
逻辑矛盾是指不同Agent的输出可能存在不一致。比如AI机会评分Agent给某个机会打了高分,但风险审查Agent指出这个机会有重大风险。报告生成Agent不能假装矛盾不存在,而是应该在报告中坦诚地呈现这种张力——“虽然XX方案在技术可行性和商业价值方面得分很高,但风险审查发现数据基础不足可能影响实施效果。建议先完成数据治理再启动方案实施”。
报告生成Agent的输出是Markdown格式的完整报告。报告结构按照PRD中定义的章节组织,每个章节包含标题、概述段落、主体内容和关键发现总结。章节之间通过过渡段落连接——每章结尾提出一个引导性问题,下一章开头回答这个问题。这种问答式的过渡创造了叙事连贯性,让报告读起来像一篇有条理的文章而不是一份资料汇编。
报告的语气需要统一。所有章节使用相同的写作风格——专业但不学术、直接但不生硬、自信但不夸大。报告生成Agent的Prompt中需要明确指定语气要求并给出几个示例段落作为参考。
报告生成还需要处理格式细节。表格的对齐和列宽、数字的格式化(金额用万元为单位保留一位小数、百分比保留整数)、专业术语的统一使用(同一概念不能在报告的不同地方用不同的名称)。这些格式细节虽然不涉及内容质量,但直接影响报告的专业感。
八、人工审核节点的设计
人工审核是多Agent流程中一个重要的安全阀。不是每个分析结果都需要人工介入,但在关键决策点上加入人工审核可以显著提升输出质量,同时也增加了用户参与感和信任度。
我们在流程中设计了两个人工审核节点。第一个审核节点在AI机会评分完成后、方案设计开始之前。在这个节点系统暂停执行,向用户展示评分结果的前三名AI应用机会和它们的评分详情。用户可以确认这个分析方向是否符合预期,或者指出”第二个机会其实不适合我们公司的情况,请排除它”。用户的反馈会作为额外输入传递给后续的方案设计Agent。
第二个审核节点在方案设计完成但报告生成之前。系统向用户展示方案的核心架构和实施路径概要,让用户确认方案方向。如果用户觉得方案太复杂或者方向偏了,可以在这个节点进行调整。这种”先确认方向再做详细报告”的方式避免了花大量时间生成一份用户不满意的全量报告。
人工审核节点的界面设计需要在Day 52的前端基础上增加两个审核页面。每个审核页面展示需要确认的信息和操作按钮——“确认并继续”和”需要调整”。如果用户选择需要调整,页面展开一个调整表单,让用户描述需要修改什么。用户的调整意见通过后端传递给对应的Agent,Agent根据反馈重新生成输出。
审核节点还需要支持超时自动通过。如果用户在审核页面停留超过三十分钟没有操作,系统默认通过并继续执行。这个设计防止了流程因为用户忘记审核而永远卡住的情况。超时时间可以在系统配置中调整。
九、中间结果展示与完整报告样例
中间结果展示是Day 52中分析进度页的数据来源。每个Agent完成后,其输出需要被格式化为适合前端展示的结构。
中间结果的展示格式分为两类。摘要格式用于进度页的实时展示——每个Agent完成后显示一句话的核心发现和两到三个关键数据点。比如行业研究Agent完成后展示”已识别半导体制造行业12个AI应用场景,其中良品率优化和生产排程的技术成熟度最高”。详细格式用于审核节点和报告展示页——展示完整的Agent输出内容,包含所有分析维度和详细数据。
完整报告样例是系统开发过程中必须准备的测试资产。你需要准备至少三个不同行业的完整报告样例——制造业、金融业和零售业各一份。每份报告样例都应该是经过人工审核的高质量输出,用于回归测试和演示展示。
报告样例的生成过程是先手动构造用户输入,然后让系统跑完整个Agent流程,最后由你(或领域专家)审查报告内容,修正错误和补充缺失。这个审查过程本身也是对Agent质量的深度检验——你在审查中发现的每个问题都可以追溯到具体的Agent并指导Prompt优化。
今日实践任务总结
今天的核心任务是实现完整的九个Agent和它们之间的协作流程。具体交付物如下。
第一份交付物是综合项目Agent流程v1,包含需求理解Agent、行业研究Agent、岗位拆解Agent、AI机会评分Agent、方案设计Agent、ROI Agent、风险审查Agent和报告生成Agent这八个Agent的完整Prompt和输出格式定义,以及人工审核节点的触发逻辑和处理流程。
第二份交付物是Agent输出样例,包含至少一个完整行业(如制造业-仓储管理)的所有Agent的中间输出和最终报告。这份样例用于验证Agent流程的端到端正确性。
第三份交付物是人工审核节点设计文档,包含审核触发条件、审核页面内容、用户反馈处理逻辑和超时策略的详细说明。
第四份交付物是完整报告样例,包含至少一个经过人工审核和修正的高质量完整报告,作为系统输出的标杆和质量参照。
这四份交付物合在一起,你的综合项目就有了”灵魂”——从用户输入到AI分析到方案输出的完整智能引擎。明天你将用大量的测试案例来检验和优化这个引擎,确保它在各种输入条件下都能产出高质量的结果。