DIFY智能体驱动钣金建模技术探讨和实践

前言
AI的发展与CAD的融合
人工智能(AI)是当前最为关注的技术热点,以大型语言模型(Large Language Model, LLM)为代表取得了突破性进展。通过在海量语料上的预训练,LLM 展现出卓越的语言理解与生成能力。除了大家熟知的大语言模型AI以外,视觉大模型、语音大模型、多模态大模型等也相继发布并取得长足应用和进度。尤其是多模态大模型,这是当前技术发展的前沿,旨在克服单一模态模型的局限。多模态模型可以同时理解文本、图像、声音等多种信息,并建立它们之间的深层联系。例如,它可以看一张图并回答关于图片内容的问题(视觉问答),或者根据一段文字描述生成一个短视频。在这一变革背景下,长期以符号算法与数值计算为核心的 CAD(计算机辅助设计)软件体系,也迎来了与AI深度融合并向 Agentic AI (智能体)进化的重要机遇。
AI的历史术路径和未来发展

为了理清这些新型的概念并为将来以AI为驱动核心的新工程设计体系的框架进行画像。我们首先来了解一下符号派的人工智能体系。
符号派人工智能(Symbolic AI)是早期人工智能研究的核心范式,其基本思想是假设智能行为可通过对符号结构进行逻辑化操作来实现。该体系基于物理符号系统假设(Physical Symbol System Hypothesis),认为知识可以以形式化符号、谓词逻辑、语义网络等结构进行显式表示,并通过推理机制(如一阶逻辑推理、前向/后向链式推理、基于规则的搜索与规划)实现认知的功能。
在工程领域的CAD工具的使用中,符号派方法可以通过领域知识库、专家规则集与约束求解器,支持复杂设计的推理和建模,例如CATIA的参数化模板和基于EKL的KBE知识工程应用。CATIA的EKL语言是根植于CATIA自有功能的脚本语言。用户可运用CATIA EKL整理、归纳可用于CATIA建模的知识规则,这些规则甚至可以形成专门的知识库并用于设计优化和问题求解。

图. 符号派的体系
然而,由于不同设计专业相关知识获取成本高,并且单一逻辑的智能系统应对复杂设计问题能力弱等原因,以符号派技术路径为基础的CAD知识工程应用往往需伴随着专业人员主观的知识归纳及内容制作,在其运用过程中有着较为固定的前提条件而显得不够灵活。由于专业知识的来源和形式多样,随着近年来神经网络在感知任务中的突破可以发现符号派的显式结构化推理能力与神经网络的表示学习能力形成互补,进而推动了 Neuro-Symbolic AI 的复兴,使其在自动设计、复杂规划、工业知识约束验证等场景中重新成为关键技术路径之一。

图. “Neuro-Symbolic AI”逻辑与神经网络的结合
工程设计的结构化特征和AI智能体

虽然以神经网络路径为基础的AI逐渐变得具有实用意义,但在工程设计领域,零部件的研发与三维建模通常遵循一套相对固定、体系化的流程。这一流程从需求分析、功能定义,到概念设计、结构建模、参数优化、仿真验证,形成了一个高度标准化且逻辑严密的设计链条。工程师在执行这些流程时,并非完全依赖算法自动化,而是通过积累的经验知识、规则判断与直觉权衡,实现方案的合理平衡与创新。

在这一过程中,工程师的思维方式具有显著的流程化和模式化特征:他们会根据以往类似零件的设计数据、性能反馈和失效案例,形成一套“隐性知识”或“经验模板”。面对新的设计任务时,工程师往往沿用既定的设计框架,在关键步骤上结合经验进行调整与创新,从而形成“知识驱动 + 经验修正”的设计模式。因此在当前AI工程化落地中,各类大模型仅具备例如语义推理和文本及图形等材料的生成能力,并且还是具有相当的随机错误概率,同时缺乏对外部系统的调用能力、任务状态管理能力以及多步骤流程的执行控制,因此无法直接承担工程应用级的任务。这时就要引入Agentic AI,这是具备一定自主决策与执行能力的智能体系统。不同于以往的符号智能体系下的专家系统或固定流程自动化,Agentic AI 借助各类智能大模型的通用推理与语言理解能力,能够围绕高层任务目标自主规划步骤、调用多种工具、处理多模态信息,并基于反馈持续优化。这种灵活而迭代的智能特性,与 CAD/CAE 设计分析过程的复杂性和多阶段特征高度契合。

图. Agentic AI框架
在现在大多数与AI系统对接的过程中,大多数用户通过智能体(Agent)实现工作任务与AI体系的衔接。在众多的智能体使用中,DIFY Agent是一个较好的Agentic工具。使用DIFY智能体的目的是为智能大模型提供标准化的工具调用运行时(Tool-Calling Runtime)、任务编排(Orchestration)、上下文与状态管理、可观测性与可控性,从而实现 API 调用、数据库访问、规则执行、工作流插入等应用级操作能力。通过这层智能体框架,LLM 输出的自然语言意图被映射为可执行的行为链路,并在可视化调度、权限控制、版本管理和服务化 API 层的支持下形成一个可部署、可维护、可扩展的智能系统,使模型从“推理器”升级为可执行的自治组件,满足实际生产系统的稳定性和集成需求。如下图所示,设计者可以通过发出相关的设计指令,来调动DIFY智能体工具按知识库的设计流程来进行建模活动。
图. DIFY智能体设计助手
利用智能体的产品设计系统架构

面向未来的智能化工程设计系统,应当以Agentic AI 为核心技术框架,通过自然语言交互、知识推理、工具调用和反馈迭代,实现从“被动辅助”到“主动协同”的转变。传统 CAD/CAE 系统主要依赖人工输入与固定算法执行,缺乏灵活的语义理解和决策能力。而智能化设计系统则通过引入语言驱动、目标导向、自主执行的AI智能体,使系统具备理解设计意图、生成方案、执行仿真并持续优化的能力。

系统总体结构可以分为四层
认知理解层(Cognitive Layer):负责自然语言解析、语义理解和目标提取,由大型语言模型(LLM)驱动;
推理与规划层(Reasoning & Planning Layer):基于符号-神经融合机制,进行设计逻辑推理、流程规划与约束求解;
执行与反馈层(Execution Layer):通过工具接口调用 CAD/CAE 软件,实现建模、仿真与性能分析,并将结果反馈至上层以优化设计。
数据层(Data Layer):以企业的设计流程规范、技术设计标准、标准化CAD数据为基础,为系统提供可用知识支撑和模型数据支持。
这四层之间形成一个闭环式智能协同体系,使系统既具备语言理解的灵活性,又具备工程逻辑的严谨性。

图. 智能体设计系统架构

系统运行流程介绍
在工作时用户只需通过自然语言输入设计需求,系统便可依托企业既有的业务流程,自动驱动一系列设计工具,完成从需求解析到三维模型生成的全流程产品设计。在业务工作流控制的引导下,系统会依次执行需求理解、布局设计、输入校验、三维建模与设计校验等关键步骤。每个步骤都可以调用相应的专业工具(如参数提取、布局优化、几何校验、模板复用、DFX 校验等),确保设计结果符合工程规范与制造要求。在这个过程中,Agent 与 AI 会持续学习并调用企业的知识库、RAG 底座以及 KBE 模板库,使系统能够复用成熟的设计规则与模板模型,从而实现自动建模、智能决策与高效设计。简而言之,用户只需提出需求,系统便能自动生成可用于生产的三维产品设计成果。

图. 工作流支持的智能体设计过程
接下来我们看一个实例:用户运用DIFY智能体发出指令,经过设计输入的校对、主体构建和特征追加完成典型钣金件的结构建模。最终生成的三维模型是参数化的可修改数据。在这个过程中,设计输入元素基于加强梁的知识库提供的要求进行校对。而三维数据的构建则基于对标准化参数过程(KBE模板)的调用。
系统优势与应用前景

与传统 CAD/CAE 的指令式、手工参数驱动模式相比,基于DIFY智能体的设计系统在交互、推理、知识利用与设计效率上实现全面升级:从指令输入转向自然语言理解,从固定算法转向符号-神经融合推理,从局部规则库拓展到全域知识图谱与经验记忆,并以主动优化替代被动分析,使设计过程由手动迭代变为自动规划和多目标优化。
未来,这类系统将推动CAD从“工具软件”向“智能设计伙伴”演进,不仅能自动完成建模与仿真,还能用可解释语言说明设计逻辑,辅助工程师更快推进创新与验证,为工程数字化与自主化提供核心动力。
印麟杰
钛闻软件
CATIA业务顾问
15年CAD/PDM专业服务经验,重点服务于汽车、高科技、工业设备等制造型行业;
长期服务于全国各汽车OEM厂商及相关零配件公司,为其提供基于达索各软件平台的技术解决方案及PLM规划实施;
针对机械领域的企业产品的研发,从设计造型到结构设计分析的全设计流程有着丰富的技术服务经验;
擅长于对企业中各业务部门相关设计流程、方法学的梳理和总结。基于达索产品规划和管理产品设计经验并结合二次开发搭建相关应用程序的方案和架构,提升企业的软件工具使用的效率。

关于钛闻软件

上海钛闻软件技术有限公司源自于上海江达科技发展有限公司,自2024年1月1日起,钛闻软件全面承接上海江达的人员、业务和相关资质。
钛闻软件在全国设有10个办事处,拥有超过200余人的专家顾问团队和近30年的行业经验,公司致力于向交通运输、工业装备、基础设施、航空航天、高科技电子及生命科学等行业客户提供先进的数字化解决方案及企业级应用系统。
作为达索系统重要的合作伙伴,钛闻软件在中国拥有1500多家客户。这些客户长期使用达索系统从需求、设计、工艺、仿真到制造的全生命周期解决方案,总装机量超过30000多套。钛闻软件非常注重客户的实施服务和应用支持,紧扣客户需求,引入最佳实践,让先进软件发挥出相应价值。
