38 · 术语表

📚 系列导航：上一篇〔37 常见问题排查〕帮你把跑 Codex 时最容易撞上的报错、卡壳、奇怪行为一个个排掉了。这一篇换个用法——它不是拿来从头读的，是拿来随时翻的：把全书出现过的术语收成一本随身词典，哪个词当时没记牢，回头查一下就行。下一篇〔39 企业管理与治理〕再讲团队和公司层面怎么把 Codex 管起来。

兄弟们，咱们这套教程走到这儿，已经甩出去一卡车术语了。

代理循环、沙箱、审批、推理强度、service_tier、MCP、子代理、Skill、Hook……我自己第一次系统学这类工具时，最劝退的就是这个——不是哪个概念有多难，是名词太多、还互相串门，看到第十个的时候，前面五个已经糊成一团了。

说句实话，被术语劝退是新手的通病，跟笨不笨没关系。这玩意儿的解法也简单：别背，要查。 真用到哪个词，回来翻一眼，看完接着干活——查个三五回，它自己就长脑子里了。

这一篇就是给你准备的那本随身词典。按主题分了组，每个词一句大白话解释，再补一句「在 Codex 里到底指啥」或一个类比。不用从头读，Ctrl+F 搜你卡住的那个词，看完就走。

看完这一篇，你会拿到：

一份按主题分组的 Codex 术语词典，每个词都是小白能看懂的大白话
基础概念（代理循环、上下文窗口、token）一次说清，它们是其它所有概念的地基
Codex 专有的那批词（AGENTS.md、codex exec、沙箱、审批、推理强度、service_tier、Chronicle）集中查
扩展能力五件套（MCP、子代理、Skill、Hook、Plugin）一句话区分，不再混
模型体系（gpt-5.5 这一串）的定位区分、「研究预览」什么意思、哪两个已弃用别再用

⚠️ 本篇的命令、配置键、默认行为以 Codex 官方文档为准；模型名、套餐范围这类会随版本变的东西，看到时一律以你本地 /model 面板、codex --help 实际显示为准，别背名字。

01 基础概念：所有术语的地基

这一组是「物种级」的概念——不光 Codex，几乎所有 AI 编程工具都绕不开。先把这三个吃透，后面的词才好挂上去。

代理（Agent，又叫智能体）

一句话：能自己拆任务、调工具、看结果、再决定下一步的 AI，不是一问一答的聊天框。

在 Codex 里指什么：Codex 就是 OpenAI 的「编程代理」，它能自己读代码、改文件、跑命令、跑测试，全程你看着就行。这跟你平时用的聊天机器人是两个物种——聊天框只会回你一段文字，代理会把整件事干完。

代理循环（Agentic Loop）

一句话：代理干活的基本节奏——想 → 做 → 看，一轮不行再来一轮。

类比：修水管的师傅。 他不是看一眼就报价走人——先「想」（哪儿漏了），再「做」（拧一下、换个垫片），然后「看」（开水试试还漏不漏），不行就回头再拧。Codex 干活就是这个循环：读文件、改代码、跑检查，验证没过就再来一轮，直到搞定。这套机制和 Claude Code 一模一样，换了个壳。

上下文窗口（Context Window）

一句话：模型一次能「同时看到」的信息总量，有上限，塞满了早先的内容就会被挤掉。

类比：一张办公桌的桌面。 桌子就这么大，你能摊开的文件有限。新文件铺上来，最早那几张就被推到边上、甚至掉地上——模型「忘了」前面说过啥，多半就是这么回事。所以聊太久、塞太多无关内容，它反而会变笨。这也是子代理存在的理由：把吵闹的中间产物搬出主桌面。

token（词元）

一句话：模型处理文本的最小计价单位，大致是「一个词或半个词」，你的输入输出都按它计数。

在 Codex 里指什么：两件事跟它直接挂钩——额度和钱。订阅套餐按 token 用量给你额度，API key 直接按 token 烧钱；旗舰模型的单价是轻量模型的好几倍。上下文窗口的「大小」也是用 token 量来衡量的。

术语	一句话记住
代理	会自己动手的 AI，不只是回你话
代理循环	想 → 做 → 看，不行再来一轮
上下文窗口	它一次能看到的信息总量，有上限
token	计量文本的最小单位，关乎额度和钱

💡 一句话总结：这四个是地基——代理会自己干活、循环是它的节奏、上下文窗口是它的桌面大小、token 是计价的尺子。

02 Codex 专有概念：这套工具的独门词

这一组是 Codex 自己的料，也是新手最容易「时灵时不灵」的来源。搞懂它们，你就不会再觉得 Codex 行为飘忽了。

AGENTS.md（项目说明书）

一句话：放进项目里的一个 markdown 文件，写下你这个项目的规矩，Codex 每次开工前先读。

类比：贴在工位上的便利贴。 你不会每天追着同事念「咱们用 pnpm 不用 npm」，写张便利贴贴那儿，他自己看。AGENTS.md 就是给 Codex 的便利贴：构建怎么跑、测试怎么跑、命名怎么取，写一次，它每次先读。它能放全局（~/.codex/AGENTS.md）也能放项目根目录，离工作目录越近的越优先（它约等于 Claude Code 的 CLAUDE.md 换了个名）。

codex exec（非交互命令）

一句话：不进交互界面、直接「给一句话、拿一个结果」的运行方式，专门给脚本和自动化用。

类比：自动售货机。 普通交互模式像跟柜员聊天——你问一句它答一句，来回好几轮。codex exec 像投币买水：投钱、按键、出货，一步到位、不寒暄。写进 CI、定时任务、批处理脚本里的，基本都是它。

沙箱（Sandbox）

一句话：给 Codex 画的一道边界，圈内的事它自己干，要出圈得先问你。

类比：游乐场的护栏。 护栏里的滑梯随便玩，不用你盯；想翻出去跑到马路上，就得拦一下。沙箱管两样东西——它能改哪些文件、能不能联网。常见三档：read-only（只读，啥都不许动）、workspace-write（工作区可写，日常默认，只能改你启动 Codex 那个目录里的东西、默认不许联网）、danger-full-access（完全访问，名字带 danger 不是吓你的，慎用）。

审批（Approval，审批策略）

一句话：Codex 要「出圈」时，停不停下来问你——这是和沙箱并排的另一个旋钮。

类比：门口保安的脾气。 沙箱是那道门，审批是保安松还是紧。untrusted 只拦陌生命令，on-request 默认在圈里干、要出圈才问你（最常用的平衡档），never 闷头干不打扰你。记住：沙箱管「能不能」，审批管「问不问」，两个维度别混。

推理强度（Reasoning Effort，配置键 model_reasoning_effort）

一句话：让模型「动手前想多久」的旋钮，想得越久通常越准、但越慢。

类比：考试时给的答题时间。 同一个学霸，让他扫一眼就答、跟让他打草稿反复验算再答，质量天差地别，但后者明显更慢。五档：minimal（几乎不想，秒答）、low、medium、high、xhigh（顶格，看模型支不支持）。结果不满意先别急着换模型——往上提一档常常就解决了；嫌慢就降一档。

推理摘要（配置键 model_reasoning_summary）

一句话：你想看多少它的「思考过程」。

在 Codex 里指什么：取值 auto / concise / detailed / none。想看它怎么一步步想的，调 detailed；觉得刷屏碍事，调 none 直接关。纯体验开关，跟结果质量无关。

服务层级（service_tier）

一句话：给你的请求排个优先级——是优先省钱还是优先快。

类比：快递的标快和特快。 fast（快速）官方明确是「加 credit 把模型提速 1.5x」，像特快加钱保时效；flex（弹性）更偏常规档、不额外加速。赶时间且不在乎那点 credit 消耗，可以试 fast，否则默认就好。

config.toml（配置文件）

一句话：Codex 的总配置文件，放在 ~/.codex/config.toml，TOML 格式。

在 Codex 里指什么：上面这些旋钮——默认模型、推理强度、沙箱模式、审批策略、MCP server——想让它每次启动都生效，就写进这个文件。临时改用斜杠命令，永久改写这里。

Chronicle / 记忆（Memory）

一句话：让 Codex 记住你早先聊过的偏好和项目惯例，省得每次重新交代。

在 Codex 里指什么：记忆默认是关的，要在设置里或 config.toml 的 [features] 段写 memories = true 才开，且有地区限制、存在本地。Chronicle 是实验性的研究预览，更进一步——用你屏幕上的内容帮它理解你最近在忙啥，目前只对 ChatGPT Pro、且只在 macOS 上可用。一句忠告：真正必须每次生效的规矩，写进 AGENTS.md，别指望记忆兜底。

我自己刚上手 Codex 那会儿，最先被绊住的就是沙箱——让它批量重命名文件，桌面上那两个纹丝没动，我还以为它挑食，翻文档才知道是 workspace-write 把它们圈在了我项目目录之外。这一组里最该先记牢的就是沙箱和审批这对兄弟，它俩解释了 Codex 八成的「为啥它不肯动」。

💡 一句话总结：Codex 专有词里，沙箱 + 审批管权限、AGENTS.md 管规矩、推理强度管「想多久」、codex exec 管自动化，全写进 config.toml 永久生效。

03 扩展能力：把 Codex 的本事接出去

基础和专有概念是 Codex 的「本体」，这一组是给它「加装备」的——五个词长得有点像，最容易混，我用一句话各自钉死。

MCP（Model Context Protocol，模型上下文协议）

一句话：一套统一标准，让 Codex 能接上各种外部工具——数据库、设计稿、浏览器、第三方服务。

类比：USB 接口。 Codex 默认只够得着本地文件和命令，够不着你的 Figma、最新文档、线上数据库。MCP 就是那个统一接口：接一次，一堆外部工具就全摆到它面前。 不用为每个工具单独写对接代码，这正是「标准」的价值。

子代理（Subagent）

一句话：主对话临时派出去、并行干专项活的小代理，各干各的、只把摘要汇总回来。

类比：分头办事的几个跑腿。 你（主线）要把一次改动从安全、性能、测试三个角度都审一遍，犯不着自己顺着查三趟——派三个跑腿同时出门，回来各递一份摘要。关键点：Codex 绝不自动拆活，得你在话里明说「开几个 agent 并行、等齐、回汇总」它才动。它的核心价值是把吵闹的中间产物搬出你的主桌面（还记得上下文窗口吗）。

技能（Skill，Agent Skills）

一句话：把一套固定步骤打包成一身本事，写一次，之后 Codex 随手就能照着做。

类比：菜谱卡。 「总结未提交的改动并标出风险」这种你反复要它做的活，与其每次重打一遍指令，不如写成一张菜谱卡（SKILL.md），里头写清 name、description 和步骤。之后点名就能调，或者它根据你的话自动匹配。手机上的「快捷指令」也是这个味儿。

钩子（Hook）

一句话：挂在 Codex 干活生命周期某个时机上的自动脚本，事件一发生它必然触发。

类比：自动感应灯。 它不关心你是谁、要去哪，只要「有人经过」这个事件发生，灯就必然亮。Hook 就是这样——在「调工具前」「调工具后」「答完话」「会话开场」这些时机，自动跑你指定的脚本。它和 AGENTS.md 的差别在于：手册是「请求」，Hook 是「必然兑现的保证」。

插件（Plugin）

一句话：把若干 Skill、MCP server、集成打成一个套装盒，一次装齐、整体管、整体撤。

类比：装修的「整套样板间」。 散件买，你得逐个找货号、对尺寸、自己拼；打成套装，一个订单到手就是样板间那样。单条工作流自用，写个 Skill 就行；要跨项目复用、团队共享、统一发版本，才值得打成插件。

术语	一句话区分	你什么时候碰它
MCP	接外部工具的统一接口	想让它连数据库 / 设计稿 / 浏览器
子代理	并行干专项活、回汇总	一件事要从多个角度同时审
Skill	把固定步骤打包成一招	同一套流程你反复要它做
Hook	特定时机自动触发的脚本	想强制「每次都自动跑某件事」
Plugin	一堆能力打成套装一键装	要团队共享、统一管理一整套配置

💡 一句话总结：MCP 接工具、子代理分活、Skill 打包流程、Hook 卡时机、Plugin 装整套——五个词，记住「各自解决什么问题」就不会混。

04 模型相关：派谁去干活

最后这组关乎「敲下回车那一刻，背后是哪个模型在帮你」。模型名会随版本变，这里讲的是定位和概念，具体有哪些一律看你本地 /model 面板。

gpt-5.5（旗舰、默认）

一句话：当前推荐的旗舰模型，最强也最贵，不设置就默认用它。

在 Codex 里指什么：复杂编程、跨模块重构、难缠 bug、研究类工作流，派它准没错。多数情况这就够用，你从没设过就是它。

gpt-5.4-mini（轻量、快而省）

一句话：轻量模型，跑得快、花得少，适合又多又简单的活儿，也常给子代理用。

在 Codex 里指什么：改小 bug、调格式、补注释、批量清理这类「体力活」，派它比派旗舰省钱省时间。

gpt-5.4（正式版，区别于 mini）

一句话：介于旗舰和 mini 之间的正式模型，也在用、没被淘汰，和 gpt-5.4-mini 是一组，别把两者搞混。

在 Codex 里指什么：「名字一样但没有 mini」——它比 mini 更强，但比 gpt-5.5 旗舰省钱省时间；要平衡质量和成本时可以考虑它。gpt-5.4-mini 是它的轻量档，两者不是同一个模型。

gpt-5.3-codex-spark（即时型，研究预览）

一句话：为「秒回」优化的即时型模型，适合连珠炮式的高频迭代。

在 Codex 里指什么：它是研究预览，目前只对 ChatGPT Pro 开放，没看到它很正常，不是你装错了。需要它问一句你秒答一句的现场结对时才用得上。

研究预览（Research Preview）

一句话：官方放出来给小范围用户先试的「提前体验版」，功能可能随时变、范围常受限。

在 Codex 里指什么：像 gpt-5.3-codex-spark、Chronicle 这些标着「研究预览」的东西，共同点是——可能只对某套餐 / 某平台开放、随版本说没就没。看到这四个字，就当它是「尝鲜功能，别拿来扛生产」。

已弃用模型（Deprecated）

一句话：官方已经标为淘汰、不再推荐的旧模型，别再写进配置。

在 Codex 里指什么：gpt-5.2 和 gpt-5.3-codex 在 ChatGPT 登录方式下已被官方标为弃用。如果你的脚本、config.toml 或 codex exec --model 里还写着它们，趁早换成最新的。 我自己上个月就栽过——一个半年前写的自动化脚本里硬编码了老模型名，跑起来直接报模型不可用，翻了半天才想起是这茬。

模型	定位	最适合
`gpt-5.5`	旗舰、默认	复杂编程、重构、难缠 bug、研究
`gpt-5.4`	正式版（中间档）	平衡质量与成本
`gpt-5.4-mini`	轻量、快省	简单批量活、给子代理用
`gpt-5.3-codex-spark`	即时型（研究预览）	高频实时迭代，求秒回
`gpt-5.2` / `gpt-5.3-codex`	已弃用	别再用，换成最新的

💡 一句话总结：旗舰 gpt-5.5 啃硬活、gpt-5.4 中间档、gpt-5.4-mini 跑快省、gpt-5.3-codex-spark 求秒回；「研究预览」=尝鲜版，弃用的两个名字别再写进配置。

05 怎么用好这本词典

词典这东西，放着不用就是摆设。给你三个我自己实测有效的用法：

第一，读其它篇卡住时，回这儿搜词、看完就走。 别在术语上死磕，这一篇就是给你随时打断、随时回查的——这正是它和其它篇的区别：其它篇从头读，这篇 Ctrl+F 着用。

第二，把「最容易混的几对」单独记牢。 我自己最初栽过跟头的就那么几对，列出来你照着核对：

容易混的一对	怎么区分
沙箱 vs 审批	沙箱管「能不能」，审批管「问不问」
推理强度 vs 模型	强度是「想多久」，模型是「派哪个人」
`AGENTS.md` vs 记忆	手册是必然生效的规矩，记忆是概率性的回忆
Skill vs Plugin	Skill 是一招，Plugin 是一堆招打的套装
子代理 vs Hook	子代理你开口才拆，Hook 到点必触发

第三，动手验一遍最快记牢。 拿你最常忘的那个概念，去对应章节跑一遍它的动手环节——比如对沙箱没感觉，就回〔02 核心概念〕跑那个「只读模式下建文件被拦」的小实验。我带过几个完全不懂命令行的朋友入门 Codex，凡是亲手跑过一遍沙箱拦截的，没一个再问我「它为啥不肯改文件」——亲眼见一次，顶看十遍解释。

💡 一句话总结：这本词典是用来「随时查」的——卡住就搜词、混淆的几对单独记、最不熟的那个概念回去动手跑一遍。

小结

这一篇把全书的术语收成了一本随身词典，分四组钉死：

基础概念：代理、代理循环、上下文窗口、token——所有概念的地基。
Codex 专有：AGENTS.md、codex exec、沙箱、审批、推理强度、service_tier、Chronicle——这工具的独门词，也是「时灵时不灵」的来源。
扩展能力：MCP、子代理、Skill、Hook、Plugin——五件套各解决一个问题，记「干啥用的」不混。
模型相关：gpt-5.5 这一串的定位、研究预览是啥、哪两个已弃用。

你现在应该能：再看到任何一篇里冒出的术语，知道回这儿哪一组找；把最容易混的几对一眼分清；碰到没感觉的概念，知道回对应章节动手验一遍。

说到底，术语从来不是用来背的，是用着用着就刻进肌肉的。这本词典的作用，就是在它还没刻进去之前，给你一个随时能查的兜底。

下一篇〔39 企业管理与治理〕，咱们把镜头从「一个人怎么用 Codex」拉到「一家公司怎么把 Codex 管起来」：权限怎么统一发、合规怎么兜底、几十上百号人用同一套工具怎么不乱套。留个小思考——你回头看这一篇里的沙箱和审批，当只有你一个人用时它们是「自己给自己设的安全带」，那当一个团队几十人共用时，这条安全带该由谁来系、能不能让人随手解开？ 这正是下一篇要解的题。

38 · 术语表 ​

01 基础概念：所有术语的地基 ​

02 Codex 专有概念：这套工具的独门词 ​

03 扩展能力：把 Codex 的本事接出去 ​

04 模型相关：派谁去干活 ​

05 怎么用好这本词典 ​

小结 ​