在数字化浪潮持续推进的当下,图像创作与编辑领域对高效、智能的技术解决方案需求日益凸显。基于此,光明实验室生成式大模型团队成功构建了自主创意智能体系统。该智能体支持多角色协同与可追溯管理,凭借强大的工具调用能力,可高效完成各类复杂的图像生成与编辑任务,适用于电商运营、品牌宣传、媒体配图等高频场景。
自主创意智能体以Google SDK为开发工具,通过多模态输入接口实现灵活交互,核心架构由记忆模块、规划生成模块、执行模块及专家智能体池构成。各智能体协同联动,记忆模块留存关键信息优化迭代,规划模块制定精准执行路径,执行模块调用专家智能体池资源落地任务,共同支撑起完整的图像创作智能工作流程。
自主创意智能体凭借其完善的技术架构,目前已具备多项实用功能,能够满足不同场景下的图像创作与编辑需求。
❤ 白底图生成营销图:针对营销场景中对产品展示的需求,可将普通白底图快速转化为具有吸引力的营销图,省去了人工设计的繁琐流程,大幅提升了营销物料的制作效率。
“给输入的产品图生成一个比较好的营销图,并配上合适的文案。预计在在美国销售。”
❤ 多图生成:支持根据用户设定的主题、风格等参数,一次性生成多张符合要求的图像,适用于需要批量图像素材的场景,如网站配图、宣传册制作等。
“为这个电饭煲设计四个不同的商品宣传图,需要添加适当的文字,需要具有商业宣传功能”
❤ 对话修图:通过自然语言对话的方式,用户可直观地表达对图像的修改需求,智能体能够精准理解并执行修图操作,实现了修图过程的便捷化、智能化,即使是非专业人士也能轻松完成图像修改。
“把刚才生成的第4张图片变为一个合家欢乐的温馨家庭场景,但是保留原先的物品和氛围,生成一个商品宣传图”
❤ 多图衍生:以现有图像为基础,智能体可衍生出多种风格、构图不同的新图像,为用户提供更多创意灵感,丰富图像素材库。
“根据洞洞鞋和军靴的风格,帮我设计一款军靴式样的洞洞鞋,颜色需要与我提供的军靴一致,并且在鞋帮的位置印上ZYH三个字母作为标志”
❤ Deepsearch 调研 + 生成:融合深度搜索能力,先对相关主题进行全面调研,获取丰富的信息与素材,再结合调研结果生成符合需求的图像,使生成的图像更具针对性和实用性。
“搜索3-4件年轻女性连衣裙,总结这些裙子的特点和时尚要素,参考这些特点和要素,然后生成3件新的连衣裙”
为让更多用户体验到自主创意智能体的强大功能,目前我们已开放试用通道。
http://139.159.243.108:5001/
自主创意智能体是一款面向图像生成与编辑的智能工具,支持多角色协同和工具调用,具备记忆、规划、执行及专家智能体池功能,可高效完成营销图、多图生成、对话修图等任务,提升创作效率与质量。未来,团队将持续丰富工具库,优化智能体的规划与协作能力,同时探索更多行业场景应用,推动智能体在图像创作、品牌宣传、教育培训等领域的高效落地,为数字创意产业发展提供有力支撑。