数字旗手

跟着OpenCode学智能体设计和开发2：工具系统

Posted on 2026-01-17 Edited on 2026-02-13 In coding Disqus:

工具注册：内置工具与可扩展性工具注册表是 OpenCode 系统中管理所有可用工具的核心组件，为内置工具和自定义工具提供了统一的接口。这种架构使 agents 能够通过一致的 API 访问多样化的功能集，同时通过插件和基于配置的工具定义支持可扩展性。工具注册表架构工具注册表采用集中式类插件架构，其中工具通过元数据、功能和权限要求进行注册。注册表维护两类工具：随 OpenCode 附带的内置工具，以及可由用户或第三方插件添加的自定义工具。内置工具静态注册在 all() 函数中，包括文件操作、搜索功能、bash 执行和 web 交互等核心功能。自定义工具在运行时初始化期间从配置目录和插

跟着OpenCode学智能体设计和开发1：Agent系统

Posted on 2026-01-12 Edited on 2026-02-13 In coding Disqus:

OpenCode Agent系统是一个多智能体架构，通过定义Agent结构，使用Task工具实现Agent间调用，集成Permission权限系统进行访问控制，通过Session会话处理器处理交互，并使用Tool工具系统提供可扩展能力。 Agent 类型和模式：主 Agent、子 Agent 和隐藏 Agent 本部分解释了 OpenCode 中 Agent 的架构组织，涵盖了三种不同的 Agent 类型（主 Agent、子 Agent 和隐藏 Agent）、它们的运行模式、配置机制以及它们如何在会话管理系统内进行交互。架构概述 OpenCode 的 Agent 系统围绕 Agent.I

跟着OpenCode学智能体设计和开发0：核心架构

Posted on 2026-01-11 Edited on 2026-02-13 In coding Disqus:

OpenCode最近很火，它不仅仅是另一个用于代码的 AI 聊天机器人——它是一个综合性的开发环境，能够理解你的项目结构，执行命令，并在你的监督下进行真正的代码更改。通过它可以学习一个强大的智能体是怎么设计和开发。接下来，通过分析OpenCode的源码，来深入学习，这里大量用到了另外2个代码仓智能分析工具Zread和DeepWiki。核心架构 OpenCode 的核心采用了客户端/服务器架构，其中强大的后端服务器负责管理 AI 交互、文件操作和工具执行，而各种客户端界面（CLI、桌面应用、Web）则提供了与这些功能无缝交互的方式 packages/opencode/src/index.

【翻译】Cursor的动态上下文发现

Posted on 2026-01-10 Edited on 2026-02-13 In Vibe coding Disqus:

之前研究过一篇LangChain的工程师Lance Martin和Manus的联合创始人Peak（季逸超）关于上下文工程的研讨，博文见这里，最近Cursor的工程师Jediah Katz也分享了一篇关于Cursor中关于上下文工程的优秀实践，这里对该文章进行翻译学习：Cursor原文在这里发布时间：2026 年 1 月 6 日作者：Jediah Katz 来源：Cursor 官方博客（Research）编码 Agent（智能体）正在快速改变软件构建的方式。它们的快速进步既来自模型本身能力的提升，也来自更优的上下文工程设计，用以更好地引导其行为。 Cursor 的 agent

一步步从0开发一个微信小程序

Posted on 2026-01-02 Edited on 2026-02-13 In Vibe coding Disqus:

微信小程序以其轻量、便捷、跨平台的特性，成为了连接线上线下的重要工具。本教程将根据微信小程序最新的开发文档，从零开始，一步步开发一个功能完整的 “待办事项 (Todo List)” 小程序。目标功能我们将开发的Todo List小程序将具备以下功能： 1. 添加待办事项：用户可以在输入框中输入新的待办事项并添加。 2. 显示待办事项列表：所有待办事项以列表形式展示。 3. 标记完成/未完成：每个事项可以被标记为已完成或未完成。 4. 删除待办事项：可以从列表中删除某个事项。 5. 数据持久化：关闭小程序后，数据不会丢失（使用本地存储）。准备工作在开始开发之前，需要准备以

AI驱动的敏捷开发方法论和框架BMAD-METHOD介绍

Posted on 2026-01-01 Edited on 2026-02-13 In Vibe coding Disqus:

前言：什么是 BMAD-METHOD？ bmad-code-org/BMAD-METHOD (Breakthrough Method for Agile Ai Driven Development) 是一套AI 驱动的敏捷开发方法论和框架。核心理念：它不仅仅是让 AI 写代码，而是将 AI 角色化（Context Engineering）。它在IDE中构建了一个“虚拟软件开发团队”，包括： * Analyst (分析师)：负责创意和需求分析。 * PM (产品经理)：负责撰写 PRD（产品需求文档）。 * Architect (架构师)：负责技术选型和系统设计。 * Scrum

上下文即新内存：解读LangChain与Manus的智能体工程哲学

Posted on 2025-11-23 Edited on 2026-02-13 In Vibe coding Disqus:

1个月前（2025年10月15日），LangChain的工程师Lance Martin和Manus的联合创始人Peak（季逸超）有一个关于上下文工程的网络研讨，录屏在这里；潘锦有一篇非常好的笔记，在这里。这里将基于Youtube的视频录屏和潘锦的笔记，融合学习记录一下。前言当大模型厂商竞相宣扬 100万甚至 200万 Token 的超长上下文窗口时，身处生产一线的工程师们却发现了一个残酷的现实：“能放得下”并不等于“能处理好”。在构建复杂 AI Agent（智能体）的过程中，上下文不仅是信息的容器，更是成本、延迟与智能水平的制约瓶颈。Lance和Pete的对话揭示了当前 AI 顶

Claude Skills与Prompts、Projects、MCP和Subagents的比较【翻译】

Posted on 2025-11-23 Edited on 2026-02-13 In coding Disqus:

随着引入 Skills（技能），越来越多人对 Claude 的“智能体 (agentic) 生态系统”中各个组件如何协作很感兴趣。无论你是在构建 Claude Code 的复杂工作流、用 API 打造企业解决方案，还是在 Claude.ai 上最大化个人效率，知道什么时候该用什么工具都会极大地改变你与 Claude 的协作方式。本指南将分解每个构建模块 (building block)，解释何时使用，以及如何将它们组合起来，形成强大的代理工作流。理解智能体的构建模块 (agentic building blocks) 什么是 Skills？ * Skills 是一个文件夹，里面包含

SAM3（Segment Anything Model 3）：新一代可提示概念分割技术

Posted on 2025-11-21 Edited on 2026-02-13 In computer vision Disqus:

引言：从实例分割到概念分割的演进在多模态人工智能（AI）领域，对视觉场景进行精确的查找与分割是一项基础性能力，它为机器人技术、内容创作、增强现实、数据标注乃至更广泛的科学研究等应用提供了核心支持。SAM（Segment Anything Model）系列模型通过引入可提示视觉分割（Promptable Visual Segmentation, PVS）任务，在图像和视频分割领域取得了重大突破。这些模型能够根据点、框或掩码等提示，精确分割出单个目标对象。然而，这一范式也存在其固有的局限性：每次提示仅能处理一个对象，无法应对更普遍的“概念级”分割需求，例如，一次性找出并分割出图像中“所有的鱼”，

开源身份认证与授权系统Authentik使用体验

Posted on 2025-10-08 Edited on 2026-02-13 In coding Disqus:

Authentik是目前在自托管领域非常受欢迎的开源身份认证与授权系统，它是很多现代应用（包括FastAPI、Vue、Kubernetes Dashboard、Grafana 等）常用的统一身份认证（SSO）解决方案。它可以实现的主要功能清单如下：类别功能描述🧑 用户管理用户注册、密码找回、邮箱验证、分组、属性扩展🔐 登录方式用户名+密码、MFA（TOTP、短信、WebAuthn）、社交登录🔄 单点登录 (SSO)完整支持 OIDC、OAuth2、SAML 2.0🎟️ 授权内置 RBAC（角色、组、策略），支持自定义规则（Python 表达式）🧾 应用管理可以为任意外部应用注册