Pi 系列 01|用最小例子看 agent runtime 的事件流
系列开篇 · Step 0 · 跑通 pi SDK,把事件流打出来 写在前面 Pi 是一个开源的 LLM agent harness,分层清晰,核心抽象齐全(turn、事件流、provider、工具、session、extension),可通过 SDK 与 extension 定制。 这个系列关心的不是”怎么调一次 LLM API”,而是一个 agent harness 如何把模型、...
系列开篇 · Step 0 · 跑通 pi SDK,把事件流打出来 写在前面 Pi 是一个开源的 LLM agent harness,分层清晰,核心抽象齐全(turn、事件流、provider、工具、session、extension),可通过 SDK 与 extension 定制。 这个系列关心的不是”怎么调一次 LLM API”,而是一个 agent harness 如何把模型、...
分享下最近了解的一门课程,来自吴恩达在 DeepLearning.AI 上的AI Prompting for Everyone,下面按主题重新整理了下 AI 的知识来自哪里 课程前几节把模型回答时的知识来源拆成了三种: 预训练知识:模型训练时读过的内容,有训练数据的时间截止点;超出截止点的内容它默认不知道,可能会编(hallucinate)。 Web Search:联网搜...
之前提到过 karpathy 大神的 autoresearch 这个项目,仓库本身只有几个文件,但它要解决的问题挺有意思: 如何让 Agent 在固定预算下连续运行几十上百轮神经网络训练实验,同时控制上下文规模。 一、架构 1.1 项目定位 autoresearch 不是一个完整的训练框架。研究流程主要围绕三个文件展开: prepare.py:固定数据、tokenize...
最近有位读者问起 Ralph Loop 和 Stop Hook,我顺便来整理这个话题。 这个话题我将分为两篇:这篇主要是 Stop Hook 和 Ralph Loop 的原理解析,下一篇会讨论如何结合这些机制,设计一个长周期运行的 Agent 循环。 先了解两个概念 Stop Hook Claude Code / Codex CLI 的 hooks 系统中的一类事件。触发时机是:...
1. 为什么需要 ACP AI 编码助手(Agent)正在快速发展,但生态存在一个结构性问题:N 款编辑器 × M 款 Agent = N×M 套适配方案。每一款 Agent 都需要为 VS Code、JetBrains、Zed 等编辑器分别开发插件,反之亦然。除了重复劳动,还有更深层的矛盾——Agent 若要修改文件或执行终端命令,要么由各编辑器自行实现一套私有 API,要么直接调用系统...
这篇文章想单独讨论一个更具体的问题: 一个 Agent 处理到第 50 个文件时,突然开始自己写脚本批量操作——你会不会第一反应觉得它变聪明了?其实它已经开始失控了。 如果只看表面,今天关于 Agent 的讨论很容易落到 prompt、模型能力和工具数量上。但把几份材料连在一起看,再对照一次真实工程复盘,问题会变得更具体一些:为什么需求更清楚了、工具更多了、上下文也更长了,Age...
接入 OpenClaw 的人都知道,光有大模型不够,你的 Agent 还得能 联网搜索。 一搜“AI Agent 搜索方案”,满屏都是 Tavily、Brave Search、Exa 这类服务。先注册,后拿 Key,再看额度和价格。 但还有一条路:自己部署一个 SearXNG,先把 Agent 的搜索能力接起来。 今天这篇文章主要讲三件事: 对比主流搜索方案的真实成本 用 ...
最近这段时间,我持续用了 Superpowers。它给我留下印象最深的,不是代码生成本身,而是其中的 brainstorming。 Superpowers 在 README 里对自己的定位是: “A complete software development workflow for your coding agents, built on top of a set of comp...
最近在 reddit 看到一个关于 Claude Code Cheatsheet 帖子,对照整理成中文版如下 快捷键 ESSENTIAL(基础) Enter:发送消息 / 提交 Esc:中断 / 停止生成 Esc Esc:打开回溯菜单(回到对话或代码状态) Ctrl+C:取消当前操作(强制停止) Ctrl+D:退出 Claude Code Shift+Tab:...
之前已经写过两篇关于 Agent Skill 的文章: 从 Prompt 到 Skills:Claude 和 LangChain 带来的 AI 新范式:主要从「能做什么」和「为什么有用」的角度来了解 Skill Skills 与 Prompts、MCP 以及 Subagents 之间的对比说明:把 Skill 放到 Claude 技术栈里,和 Prompts / MCP / Su...