其他教程

其他教程

Products

当前位置:首页 > 其他教程 >

昆仑万维「天工 SkyAgents」Beta 版全网测试

GG网络技术分享 2025-03-18 16:16 0


12 月 25 日,昆仑万维 AI Agents 开发平台「天工 SkyAgents」Beta 版正式开放测试,用户可在 https://model-platform.tiangong.cn/ 立即体验。

昆仑万维「天工 SkyAgents」AI Agents 开发平台,基于昆仑万维「天工大模型」打造,具备从感知到决策,从决策到执行的自主学习和独立思考能力。用户可以通过自然语言构建自己的单个或多个 “私人助理”,并能将不同任务模块化,通过操作系统模块的方式,实现执行包括问题预设、指定回复、知识库创建与检索、意图识别、文本提取、http 请求等任务。

在大模型技术高速发展、AI Agents 应用不断进步的当下,昆仑万维「天工 SkyAgents」是我们在智能体领域的一次探索与尝试。这个平台也许并不完美,但我们希望与广大开发者们携手共建、互助成长,不断开拓人工智能技术的应用边界。现在不完美是为了未来的完美,我们一直在技术追求的过程中,坚信而勇于突破。

携手探索,合作共创

大模型时代,交互式 AI 有望成为未来大模型技术的主流落地方向。历史告诉我们,新兴事物的演进总会找到一个稳定的术语来描述这种载体,而 AI Agents(智能体)已经显现出了巨大潜力。

目前,全球对智能体的关注异常热烈,OpenAI 高度关注智能体领域,并在 OpenAI dev day 发布会上发布了自定义 GPTs 以及 Assistance API;DeepMind 的联合创始人最近也提到下一代人工智能技术的发展方向将是交互式 AI,而不是生成式 AI。这种交互式 AI 很大程度上与智能体的描述是相符的,用户可以通过要求智能体完成各种任务,而智能体则可以操作软件或与人类协作,完成复杂场景的工作。

在技术范式上,昆仑万维也在不断思考驱动智能体技术快速发展的底层技术和架构。我们同时也清楚地认识到,即使在大模型的语言交互能力的加持下,我们离一个完全可以自动做决策并执行任务的智能体还有距离。

今天,昆仑万维正式开放「天工 SkyAgents」Beta 版,作为我们在 AI Agents 技术能力和应用能力上的一次探索。我们希望通过此次探索,能让越来越多的用户与开发者能够将大模型技术应用到工作生活中,打造出满足日常需求、激发灵感创新的专属 AI Agents。我们也希望更多对 AI Agents 感兴趣的朋友们能够与我们一同携手共创。欢迎广大伙伴们提出建议与意见。

Image

什么是 AI Agents?

Agent 一般译为 “智能体” 或 “代理”,其概念最早由麻省理工学院人工智能实验室(MIT AI Lab)创始人之一 Marvin Minsky 在其 1986 年出版的《思维的社会》一书中提出。它由社会与社会行为概念被引入计算系统内,指的是在某一环境下,能持续自主地发挥作用的计算实体。

AI Agents 指的则是由人工智能技术驱动,能够感知环境、进行决策和执行动作的智能实体。

AI Agents 并不是一个新兴的概念,自人工智能技术学科建立以来,就陆续有围绕 AI Agents 的研究出现。2012 年深度神经网络浪潮兴起后,有一支以强化学习训练 AI Agents 的学术派系诞生,轰动全球的围棋机器人 AlphaGo 可以看作是这一流派的研究成果。不过,此类 AI Agents 更适合对抗性游戏场景,在真实世界中较难落地。

然而,大模型的出现改变了这一切。

2023 年,随着大模型技术在自然语言理解、工程能力、数据能力、存储能力等领域的突破,大量对话交互类 “GPT” 涌现,以大模型技术驱动的 AI Agents 在通用性、实用性、可落地性等都得到了飞速发展,在全球掀起了又一阵 AI Agents 热潮。

传统大模型应用大多基于 Prompt(用户提示词)实现,Prompt 的质量将直接影响大模型的回答效果,缺乏提示词工程能力的普通用户难以将大模型的真正能力发挥到极致。而 AI Agents 只需要用户给定工作目标,就可以通过独立思考、调用工具去逐步完成任务,极大降低大模型技术应用门槛。

AI Agents 三大核心模块:大脑、感知、执行

根据复旦大学论文《The Rise and Potential of Large Language Model Based Agents: A Survey》,AI Agents 可以划分为大脑(Brain),感知(Perception)、执行(Action)三大模块化能力。

Image

(图片来源:《The Rise and Potential of Large Language Model Based Agents: A Survey》)

1. 大脑(Brain)

大脑是 AI Agents 的 “核心信息处理中心”,具备理解当前环境并形成 “记忆(Memory)” 的能力,同时也具备存储并检索长期记忆的能力。“大脑” 可以根据 “记忆” 和当前接收的信息进行逻辑推理,并将复杂问题拆解成可实现的子任务,应对复杂场景任务。同时,通过 RAG(检索增强生成)技术,AI Agent 可以根据当前场景和用户设定的目标进行进一步决策,实现独立思考、规划(Planning)和推理(Reasoning)。

2. 感知(Perception)

感知模块能够让 AI Agents 基于当前的环境和场景获取足够的信息,这正是其与传统 RPA 系统的区别之处。RPA 系统在面对大量未知信息、难以预测的环境时无法进行工作,AI Agents 则可以通过感知信息并做出对应的思考和行动,从而实现感知、理解和自主探索世界。

3. 执行(Action)

执行模块赋予了 AI Agents 执行任务的权限和能力。AI Agents 在接收到用户任务指令后,结合由感知模块收集的当前场景信息,通过大脑进行总结和推理后,输出到执行模块中,使 AI Agents 能够根据用户需求完成指令。同时,AI Agents 拥有调用、使用工具(Tool use)的能力,这些工具可以帮助 Agents 更高效地完成复杂任务,同时也提高了其在某些具体场景中的可信度和灵活度,相关应用场景包括让 AI Agents 购买飞机票、点外卖、完成企业 IT / 客服 / 法律任务等。

天工 SkyAgents

「天工 SkyAgents」基于昆仑万维「天工大模型」打造,拥有专属 “大脑”、“感知”、“执行” 模块。

个人用户 / 开发者可以通过「天工 SkyAgents」进行自然语言和简单操作,无需代码编程能力,即可在几分钟之内部署属于自己的 AI Agents,完成行业研究报告、单据填写、商标设计、甚至健身计划、旅行航班预定等多项私人定制需求。

企业用户 / 开发者则可以将「天工 SkyAgents」的众多能力按需拼装成企业 IT、智能客服、企业培训、HR、法律顾问等众多个性化的应用,并支持一键服务部署,确保其在不同业务系统中的无缝接入。

「天工 SkyAgents」的 AI 能力背后,是昆仑万维 AI Agents 技术在模块化任务组件、智能知识库构建、第三方工具调用、个性化 AI Agents 一键分享等领域的能力积累。

1. 模块化任务组件,零代码打造专属 AI Agents

当前,多数用户既不具备代码开发经验,也不具备训练大模型提示词工程(Prompt Engineering)的能力,难以将众多日常生活的实际需求通过对话问答形式快速实现,无法将大模型能力发挥到极致。为了解决这一问题,「天工 SkyAgents」将大量任务组件模块化,集成了智能对话、信息加工、信息提取、信息分类、第三方数据获取、向量检索等能力。

  • 智能对话:智能对话模块借助 AI 能力,将用户发送的内容,通过大语言模型进行处理并回复给用户指定内容。

  • 信息加工:通过预设提示词(Prompt)的方式让大模型对特定信息输入进行加工,以获得符合需求的内容。

  • 信息提取:通过大模型对语义的理解,可以从输入信息中提取目标信息

  • 信息分类:借助大模型的智能分析,将用户问题进行分类,针对不同类型的问题执行不同操作,方便进行个性化处理;

  • 第三方数据获取:第三方数据接入会携带相关的参数,系统向指定地址发送 POST 请求,并接收响应。系统在携带相关参数的同时,可以实现与其他应用服务的数据互联互通。基于第三方数据获取模块可以极大扩展 AI Agents 的能力,打通数据库操作、联网搜索等更多场景。

  • 向量检索:针对常见的用户提问,系统可以将问题添加进知识库,便于搜索和查找。而对于 “知识库” 模块而言,用户可以输入问题,系统将在知识库中搜索相关问题与解答,并用自然语言进行输出。

2. 智能知识库构建,支持大规模知识导入

大模型能力虽强,但也有其天生的弱项。一方面,大模型通过参数训练获得的知识只能停留在某一时点,更新成本很高;另一方面,大模型的训练数据通常以通用知识为主,细分领域的数据往往缺乏。为了解决这一问题,「天工 SkyAgents」支持导入更多格式和更大规模的数据和知识,给大模型增加了 “知识库外脑”。

  • 支持多种数据导入形式:文本、文件、网站、问答对、在线文档等方式,轻松将已有知识进行导入

  • 知识库 Embedding:将知识库中的内容元素表示为低维度的向量,使得知识库中的元素可以更容易地进行计算相似性、寻找相邻的实体等数学运算,从而提高了知识库在 AI Agents 中的可操作性。

  • 知识库自由链接:每个 AI Agents 可以自由链接所属知识库并同时由多个知识库进行内容供给,每个知识库也可以同时链接多个 AI Agents,知识库内容可根据需要启用和弃用,实现更灵活的知识内容管理。

3. 第三方工具调用,多场景随心应对

  • 第三方工具调用:工具调用能力是将 AI Agents 与大量对话类 GPT 区别开来的核心能力之一,比如在机票预订场景中,除了对用户需求与航班信息进行分析判断,AI Agents 还需要调用票务平台、电子支付等不同工具。因此,除了基础的模块外,「天工 SkyAgents」还支持各类第三方工具的调用,用户可以根据自身需要进行工具的开发,使得构建 AI Agent 时拥有更多灵活的自由度。

4. 个性化 AI Agents 一键分享

  • 一键分享:为了回馈广大用户与开发者们,更便捷地打造与使用 AI Agents,「天工 SkyAgents」上线新年专属活动,推出理想伴侣、有缘机伴、暖心家园三款官方新年模版,并全面简化了分发和使用流程。用户根据自己的创意设计出的 AI Agents 可以通过链接的方式向更多人分享,使用者只需点击链接,即可获得对该 AI Agents 的访问权。点击创建:https://model-platform.tiangong.cn/

能力更全面、应用更智能、分享更便捷、平台更好用。本次「天工 SkyAgents」beta 版的正式开放内容,将进一步推动大模型技术的普惠化,帮助缺乏代码开发能力的个人与中小企业积极拥抱大模型技术,助力大模型走入千家万户,为人工智能生态发展贡献力量。

标签: 天工 模型

提交需求或反馈

Demand feedback