科研动态 | 光明实验室生成式大模型团队最新进展：自主创意智能体 —

科研动态 | 光明实验室生成式大模型团队最新进展：自主创意智能体 —— 赋能图像创作与编辑新范式

发布时间：2025-08-23
作者：光明实验室
浏览：1261次

		在数字化浪潮持续推进的当下，图像创作与编辑领域对高效、智能的技术解决方案需求日益凸显。基于此，光明实验室生成式大模型团队成功构建了自主创意智能体系统。该智能体支持多角色协同与可追溯管理，凭借强大的工具调用能力，可高效完成各类复杂的图像生成与编辑任务，适用于电商运营、品牌宣传、媒体配图等高频场景。
	

		先进的多智能体协同框架
	

		自主创意智能体以Google SDK为开发工具，通过多模态输入接口实现灵活交互，核心架构由记忆模块、规划生成模块、执行模块及专家智能体池构成。各智能体协同联动，记忆模块留存关键信息优化迭代，规划模块制定精准执行路径，执行模块调用专家智能体池资源落地任务，共同支撑起完整的图像创作智能工作流程。
	

		多样化场景覆盖
	

		自主创意智能体凭借其完善的技术架构，目前已具备多项实用功能，能够满足不同场景下的图像创作与编辑需求。
	

		❤ 白底图生成营销图：针对营销场景中对产品展示的需求，可将普通白底图快速转化为具有吸引力的营销图，省去了人工设计的繁琐流程，大幅提升了营销物料的制作效率。
	

		输入示例1
	

		“给输入的产品图生成一个比较好的营销图，并配上合适的文案。预计在在美国销售。”
	

		成果展示
	

		❤ 多图生成：支持根据用户设定的主题、风格等参数，一次性生成多张符合要求的图像，适用于需要批量图像素材的场景，如网站配图、宣传册制作等。
	

		输入示例2
	

		“为这个电饭煲设计四个不同的商品宣传图，需要添加适当的文字，需要具有商业宣传功能”
	

		成果展示
	

		❤ 对话修图：通过自然语言对话的方式，用户可直观地表达对图像的修改需求，智能体能够精准理解并执行修图操作，实现了修图过程的便捷化、智能化，即使是非专业人士也能轻松完成图像修改。
	

		输入示例3
	

		 （接示例2的对话）
	

		“把刚才生成的第4张图片变为一个合家欢乐的温馨家庭场景，但是保留原先的物品和氛围，生成一个商品宣传图”
	

		成果展示
	

		❤ 多图衍生：以现有图像为基础，智能体可衍生出多种风格、构图不同的新图像，为用户提供更多创意灵感，丰富图像素材库。
	

		输入示例4
	

		“根据洞洞鞋和军靴的风格，帮我设计一款军靴式样的洞洞鞋，颜色需要与我提供的军靴一致，并且在鞋帮的位置印上ZYH三个字母作为标志”
	

		成果展示
	

		❤ Deepsearch 调研 + 生成：融合深度搜索能力，先对相关主题进行全面调研，获取丰富的信息与素材，再结合调研结果生成符合需求的图像，使生成的图像更具针对性和实用性。
	

		输入示例5
	

		“搜索3-4件年轻女性连衣裙，总结这些裙子的特点和时尚要素，参考这些特点和要素，然后生成3件新的连衣裙”
	

		成果展示
	

		未来计划与试用反馈
	

		为让更多用户体验到自主创意智能体的强大功能，目前我们已开放试用通道。
	

		试用链接：
	

		http://139.159.243.108:5001/
	

		自主创意智能体是一款面向图像生成与编辑的智能工具，支持多角色协同和工具调用，具备记忆、规划、执行及专家智能体池功能，可高效完成营销图、多图生成、对话修图等任务，提升创作效率与质量。未来，团队将持续丰富工具库，优化智能体的规划与协作能力，同时探索更多行业场景应用，推动智能体在图像创作、品牌宣传、教育培训等领域的高效落地，为数字创意产业发展提供有力支撑。
	

END

		素材来源 丨光明实验室生成式大模型团队
	

		编 辑 丨 李沛昱
	

		审 核 丨 杨怡莹  李沛昱  郭   锴

上一篇：光明实验室Science+1！李清泉院士团队发表Science长文:创新森林碳抵消基线评估方法，实现大范围热带森林碳效益精准量化，解决了森林碳信用项目争议难题

下一篇: 光明实验室数字人方向多篇研究成果被人工智能顶刊及顶会接收