Skip to content

Codex 桌面应用全部功能概览

Codex app 是一个专注的桌面体验,用于并行处理 Codex 线程,内置了 worktree 支持、自动化以及 Git 功能。

大多数 Codex app 功能在 macOS 和 Windows 上都可用。下面的部分会标注平台特定的例外情况。

使用一个 Codex app 窗口即可在多个项目之间运行任务。为每个代码库添加一个项目,并根据需要在它们之间切换。

如果你使用过 Codex CLI,那么一个项目就类似于在特定目录中启动一个会话。

如果你在一个仓库中同时开发两个或更多应用或包,请将不同的项目拆分为独立的 app 项目,这样 sandbox 只会包含该项目对应的文件。

Codex app 支持与 CLI 和 IDE Extension 相同的 agent skills。你还可以通过点击侧边栏中的 Skills,查看和探索你的团队在不同项目中创建的新技能。

你还可以将 skills 与 automations 结合使用,以执行诸如分析遥测中的错误并提交修复,或生成近期代码库变更报告等常规任务。对于需要在同一线程中持续进行的工作,请使用 thread automation

每个线程都在一个选定的模式下运行。在启动线程时,你可以选择:

  • Local:直接在当前项目目录中工作。
  • Worktree:在 Git worktree 中隔离更改。了解更多。
  • Cloud:在已配置的云环境中远程运行。

LocalWorktree 线程都会在你的计算机上运行。

有关完整的术语表和概念,请查看 concepts 部分

Codex app 在应用内直接提供了常用的 Git 功能。

diff 面板会显示你在本地项目或 worktree 检出中的更改的 Git diff。你还可以添加内联评论让 Codex 处理,并对特定代码块或整个文件进行暂存(stage)或回滚(revert)。

你还可以直接在 Codex app 中对本地和 worktree 任务进行提交(commit)、推送(push)以及创建 pull request。

对于更高级的 Git 操作,请使用 集成终端

当你创建一个新线程时,可以选择 LocalWorktreeLocal 会直接在你的项目中工作。Worktree 会创建一个新的 Git worktree,使更改与当前项目隔离。

当你希望尝试一个新想法而不影响当前工作,或者希望 Codex 在同一个项目中并行运行独立任务时,请使用 Worktree

对于 Git 仓库,automations 会在专用的后台 worktrees 中运行;对于未使用版本控制的项目,则会直接在项目目录中运行。

了解更多关于在 Codex app 中使用 worktrees 的信息

每个线程都包含一个内置终端,其作用范围限定在当前项目或 worktree。你可以通过点击应用右上角的终端图标,或按下 Cmd+J 来切换它。

使用终端可以在不离开应用的情况下验证更改、运行脚本以及执行 Git 操作。Codex 也可以读取当前终端输出,因此它可以检查正在运行的开发服务器状态,或在与你协作时参考失败的构建信息。

常见任务包括:

  • git status
  • git pull --rebase
  • pnpm testnpm test
  • pnpm run lint 或类似的项目命令

如果你经常运行某个任务,可以在 本地环境 中定义一个 action,在 Codex app 窗口顶部添加一个快捷按钮。

请注意,Cmd+K 会打开 Codex app 的命令面板,并不会清空终端。要清空终端,请使用 Ctrl+L

多层沙箱安全机制,保护你的系统安全。支持只读、工作区写入和完全访问三种模式。通过规则(Rules)可以有选择地将特定命令加入允许列表,在安全性和灵活性之间取得平衡。

在 Windows 上,Codex 可以直接在 PowerShell 中原生运行,并使用原生的 Windows sandbox,而无需依赖 WSL 或虚拟机。这使你可以在保持受限权限边界的同时,继续使用 Windows 原生工作流。

了解更多关于 Windows 设置和 sandbox 的信息

您的审批和沙箱设置会限制 Codex 的操作。

  • 审批决定了 Codex 在运行命令前何时暂停以请求许可。
  • 沙箱则控制 Codex 可以使用哪些目录和网络访问权限。

当您看到诸如 “批准一次” 或 “在此会话中批准” 之类的提示时,您正在为工具执行授予不同范围的权限。如果您不确定,请批准范围最小的选项并继续迭代。

默认情况下,Codex 将工作范围限定在当前项目。在大多数情况下,这是正确的限制。

如果您的任务需要跨多个存储库或目录进行工作,请优先打开单独的项目或使用工作树(worktrees),而不是要求 Codex 在项目根目录之外漫游。

如果您的工作区中包含自动审查功能,您可以从权限选择器中选择它。它保持相同的沙箱边界,但会通过配置的审查策略来路由符合条件的审批请求,而不是让您处于等待状态。

如需高级概述,请参阅沙箱(sandboxing)。有关配置细节,请参阅智能体审批与安全(agent approvals & security)文档。

敏感操作需要你的明确审批才能执行。你可以设置审批策略,控制哪些类型的操作需要确认——从文件修改到网络访问,按需定制。管理员可通过 requirements.toml 强制实施组织级审批策略。

附加到当前对话的心跳式定期唤醒调用。适用于需要保留对话上下文的持续任务,比如轮询 Slack/GitHub 状态、检查长时间运行的命令、或保持审查循环。使用分钟级间隔实现主动跟进,也可使用每日/每周计划。

自动化也可以附加到单个线程(thread)上。这些线程自动化是循环触发的唤醒调用,它们会保留线程的上下文,以便 Codex 能够检查长期运行的工作、轮询源以获取新信息,或者继续跟进循环。当需要进行应该按计划不断回到同一个对话中的心跳式自动化时,可以使用它们。

当上一次运行依赖于当前对话时,请使用线程自动化。当您希望 Codex 为一个或多个项目启动一个新的循环任务时,请使用独立自动化或项目自动化。


通过语音与 Codex 交互。口述指令、描述问题或提供反馈,无需打字即可驱动编码工作流。适用于快速表达想法或操作不便时的场景。

使用你的语音向 Codex 提示。当输入框(composer)可见时,按住 Ctrl+M 并开始说话。你的语音会被转录。你可以编辑转录后的提示,或直接发送以让 Codex 开始工作。

将线程弹出为独立窗口。在多显示器工作环境中特别有用,可以将 Codex 对话放在副屏上,主屏专注于代码编辑。

将一个正在进行的对话线程弹出为独立窗口,并移动到你当前工作的区域。这对于前端开发非常理想,你可以在快速迭代时,将线程放在浏览器、编辑器或设计预览旁边。

你还可以将弹出窗口设置为始终置顶,以便在整个工作流程中保持可见。

内置渲染浏览器,你和 Codex 共享同一视图。适用于预览本地开发服务器、基于文件的页面以及无需登录的公开网站。支持浏览器评论功能——在渲染页面上直接标记需要修改的元素或区域。

使用内置浏览器在你迭代 Web 应用时预览、审查并评论本地开发服务器、基于文件的预览以及无需登录的公共页面。

内置浏览器不支持认证流程、已登录页面、你的常规浏览器配置、cookies、扩展或现有标签页。

使用浏览器评论来标记页面中的特定元素或区域,然后让 Codex 根据这些反馈进行处理。

当你希望 Codex 直接操作页面时,请对本地开发服务器和基于文件的页面使用 browser use。你可以在设置中管理 Browser 插件、允许访问的网站以及被阻止的网站。

让 Codex 操控你的 macOS 桌面应用程序。处理 GUI 任务、浏览器流程和原生应用测试。Codex 可以点击、输入、截图并验证界面状态,实现端到端的桌面自动化。

Computer use 帮助 Codex 通过查看、点击和输入来操作 macOS 应用。这对于测试桌面应用、检查浏览器或模拟器流程、处理无法作为插件使用的数据源、更改应用设置以及复现仅限 GUI 的问题非常有用。

由于 computer use 可能会影响你项目工作区之外的应用和系统状态,请将任务范围保持精简,并在继续之前审查权限提示。

该功能在发布初期不在欧洲经济区(EEA)、英国或瑞士提供。

跟踪计划文件、源代码、任务摘要和生成的文件预览。产物面板让你一览线程中产生的所有重要输出,方便回顾和复用。

当任务产生非代码类产物时,侧边栏可以预览 PDF 文件、电子表格、文档和演示文稿。向 Codex 提供源数据、期望的文件类型、结构以及你关心的评审标准。

对于电子表格和演示文稿,请描述相关的工作表、列、图表、幻灯片部分以及需要检查的内容。让 Codex 说明它将输出保存在哪里,以及它是如何检查结果的。

在线程运行时,使用任务侧边栏来跟踪 Codex 的执行过程。它可以展示 agent 的计划、来源、生成的产物以及任务摘要,从而让你能够引导工作、检查生成的文件,并决定哪些内容需要再次迭代。

在桌面应用和 IDE 扩展之间共享自动上下文和活动线程。在 VS Code 中编辑代码,同时在 Codex 桌面应用中与 AI 协作,两者无缝衔接。

如果你在编辑器中安装了 Codex IDE Extension,当它们处于同一个项目中时,Codex app 和 IDE Extension 会自动同步。

同步后,你会在 Codex app 的输入框中看到 IDE context 选项。启用 “Auto context” 后,Codex app 会跟踪你正在查看的文件,因此你可以间接引用它们(例如,“这个文件是做什么的?”)。你还可以在 IDE Extension 中看到正在 Codex app 中运行的线程,反之亦然。

如果你不确定 app 是否包含上下文,可以将其关闭,然后再次提出相同的问题以比较结果。

Automations 也可以附加到单个线程上。这些 thread automations 是周期性的唤醒机制,会保留线程的上下文,使 Codex 能够检查长时间运行的工作、轮询数据源以获取新信息,或继续后续的循环任务。将其用于类似心跳(heartbeat)式的自动化场景,使其能够按计划持续返回同一个对话。

当下一次运行依赖当前对话时,请使用 thread automation。当你希望 Codex 为一个或多个项目启动一个全新的周期性任务时,请使用 standalone 或 project automation。

你的 approval 和 sandbox 设置会限制 Codex 的操作。

  • Approvals 决定 Codex 在执行命令前何时需要暂停以请求权限。
  • Sandbox 控制 Codex 可以访问哪些目录以及是否可以使用网络。

当你看到诸如 “approve once” 或 “approve for this session” 的提示时,这表示你正在为工具执行授予不同范围的权限。如果你不确定,应选择最小范围的授权并继续迭代。

默认情况下,Codex 会将工作范围限定在当前项目中。在大多数情况下,这是合适的约束。

如果你的任务需要跨多个仓库或目录工作,优先考虑打开多个项目或使用 worktree,而不是让 Codex 在项目根目录之外随意操作。

如果你的工作区支持 automatic review,可以在权限选择器中启用它。它会保持相同的 sandbox 边界,但会将符合条件的审批请求交由配置的审核策略处理,而不是等待你手动审批。

有关高层概览,请参阅 sandboxing。有关配置细节,请参阅 agent approvals & security 文档。

支持 Model Context Protocol(MCP),连接外部工具和数据源。通过 MCP 服务器扩展 Codex 的能力边界,集成自定义工具、数据库和 API。

Codex app、CLI 和 IDE Extension 共享 Model Context Protocol(MCP)设置。如果你已经在其中一个中配置了 MCP 服务器,它们会自动在其他环境中生效。

要配置新的服务器,请在应用设置中打开 MCP 部分,并选择启用一个推荐的服务器,或将新的服务器添加到你的配置中。

让 Codex 访问网络信息。在对话中搜索最新文档、API 参考或技术方案,Codex 将搜索结果融入回答,确保信息的时效性。

Codex 内置了一个一方(first-party)的网页搜索工具。对于 Codex app 中的本地任务,Codex 默认启用网页搜索,并从网页搜索缓存中提供结果。

如果你将 sandbox 配置为完全访问(full access),网页搜索将默认使用实时结果。请参阅 Config basics 以禁用网页搜索或切换为获取最新数据的实时结果。

在线程中直接生成或编辑图像。结合周围的代码上下文,Codex 可以创建 UI 原型、图表、示意图或设计资源,一切都在对话中完成。

在线程中让 Codex 直接生成或编辑图像。这对于 UI 资源、横幅、背景、插图、精灵图和占位符非常有用,你可以在编写代码的同时创建这些内容。如果希望 Codex 转换或扩展现有资源,可以添加参考图像。

你可以使用自然语言提出请求,或者在提示中显式调用图像生成技能,方法是在提示中包含 $imagegen

内置图像生成使用 gpt-image-2,会计入你的一般 Codex 使用额度,并且平均比不使用图像生成的类似操作快 3-5 倍,具体取决于图像质量和大小。有关详细信息,请参阅 Pricing。有关提示技巧和模型详情,请参阅 图像生成指南

对于更大批量的图像生成,请在环境变量中设置 OPENAI_API_KEY,并通过 API 请求 Codex 生成图像,此时将按 API 计费。

将截图、设计稿或照片直接粘贴到对话中。Codex 可以分析图像内容,根据设计稿生成代码、识别错误截图中的问题,或从图表中提取信息。

你可以将图像拖放到提示输入框中,将其作为上下文包含在内。在拖放图像时按住 Shift 键,可以将图像添加到上下文中。

你也可以让 Codex 查看你系统上的图像。通过提供工具让 Codex 截取你正在使用的应用窗口,Codex 可以验证它正在执行的工作。

管理所有对话线程。查看历史对话、恢复未完成的任务、搜索过往讨论。对话列表支持组织和归档,保持工作空间整洁。

Chats 是你可以在任务不需要特定项目文件夹或 Git 仓库时启动的线程。将其用于研究、分诊、规划、插件密集型工作流以及其他需要 Codex 使用连接工具而不是编辑代码库的对话。

Chats 使用 Codex 管理的线程目录,位于你的 Codex 主目录下,作为工作位置。默认情况下,该位置为 ~/.codex/threads

Codex 记住你的偏好、项目约定和个人风格。随着使用时间增长,Codex 逐渐学习你的编码习惯,提供越来越精准的建议。记忆跨对话共享,让每次协作都从上次中断的地方继续。

Memories(记忆)(如果可用)允许 Codex 将过去任务中的有用上下文带入未来的线程。它们在稳定的偏好、项目约定、重复的工作模式以及已知的陷阱方面最为有用,否则这些内容需要重复提供。

及时获取任务状态更新。当自动化运行完成、长时间任务结束或需要你的审批时,Codex 通过系统通知提醒你。支持自定义通知偏好。

默认情况下,当任务完成或需要审批时,即使 Codex app 在后台运行,也会发送通知。

在 Codex app 设置中,你可以选择从不发送通知,或者即使应用在前台,也始终发送通知。

防止计算机进入休眠状态。当 Codex 正在执行长时间运行的任务时,自动保持系统唤醒,确保后台自动化或远程连接不会因系统休眠而中断。

由于你的任务可能需要一段时间才能完成,你可以在 Codex app 的设置中启用 “Prevent sleep while running” 开关,让应用防止计算机进入睡眠状态。

功能说明
多任务处理跨项目并行运行线程
技能可复用的指令与工作流
自动化定时后台任务
模式本地/云端模式切换
Git内置版本控制
工作树Git 并行工作空间隔离
终端线程内置命令行
沙箱多层安全防护
语音语音交互
弹出窗口独立窗口模式
应用内浏览器内置页面预览
计算机使用操控桌面应用
产物输出文件管理
IDE 同步编辑器双向同步
对话自动化对话级定时唤醒
审批敏感操作确认
MCP外部工具集成协议
网页搜索在线信息检索
图像生成AI 图片创建
图像输入图片分析识别
对话线程管理与搜索
记忆偏好与习惯学习
通知系统状态提醒
保持唤醒防止系统休眠
-
0:000:00