llm-for-zotero 是一款免费的开源 Zotero 插件,可将大型语言模型直接集成到 PDF 阅读器中。与需要将 PDF 上传到网页端的工具不同,本插件让您无需离开 Zotero 即可与论文对话。它静静地驻留在阅读器侧栏——随时待命的研究助手。

就任意打开的 PDF 提问,回答基于论文内容并附带可点击的引用跳转。
OpenAI、Anthropic、Google Gemini、DeepSeek、本地模型——使用任何您偏好的 LLM。
自主管理文库、执行终端命令、访问本地文件的智能代理——所有变更均需您审批。
使用高保真 PDF 解析,完整保留表格、公式、图表和复杂版式。
在独立窗口中打开 LLM 助手,提供全尺寸聊天界面和对话历史侧栏。
将研究笔记保存为 Markdown 文件,可写入 Obsidian、Logseq 或任意本地笔记目录,并保留元数据、引用和图表。
8 个内置技能引导 Agent 针对常见任务采用合适工作流,支持通过 Markdown 文件创建自定义技能。
Codex App Server 认证方式,通过官方本地 codex app-server 流程免 API 密钥调用 gpt-5.4 等 Codex 模型。旧的直连后端方式仍作为 Codex Auth (Legacy) 保留给现有用户。最初的 Codex Auth 集成由 @jianghao-zhang 贡献;新的 Codex App Server 集成由 @boltma 设计。详见 Codex 配置。auto_tag 和 complete_metadata 现在可作用于当前论文、已选择论文、已选择文集或整个文库,并在批量变更前打开审阅卡片。下载最新的 .xpi 安装包
前往 Releases 页面 下载最新的 .xpi 文件。
在 Zotero 中安装插件
打开 Zotero → 工具 → 附加组件 → 点击齿轮图标 → 从文件安装附加组件 → 选择 .xpi 文件。
重启 Zotero 重启 Zotero 完成安装。插件会在每次启动时自动检查更新。
打开 首选项 → 切换到 llm-for-zotero 标签页。

插件原生支持以下五种服务商协议:
| 协议 | 说明 | 主要功能 |
|---|---|---|
responses_api |
OpenAI Responses API | 流式输出、工具调用、文件上传、多模态 |
openai_chat_compat |
OpenAI 兼容聊天 API | 流式输出、工具调用、多模态 |
anthropic_messages |
Anthropic Messages API | 流式输出、工具调用、多模态 |
gemini_native |
Google Gemini API | 流式输出、工具调用、多模态 |
codex_responses |
Codex App Server / Codex Auth (Legacy) | ChatGPT Plus 订阅用户可免单独 API 密钥使用 Codex 模型,推荐选择 Codex App Server |
| API 地址 | 模型 | 推理等级 | 备注 |
|---|---|---|---|
https://api.openai.com/v1/responses |
gpt-5.4 | default, low, medium, high, xhigh | 支持 PDF 上传 |
https://api.openai.com/v1/responses |
gpt-5.4-pro | medium, high, xhigh | 支持 PDF 上传 |
https://api.deepseek.com/v1 |
deepseek-chat | default | |
https://api.deepseek.com/v1 |
deepseek-reasoner | default | |
https://generativelanguage.googleapis.com |
gemini-3-pro-preview | low, high | |
https://generativelanguage.googleapis.com |
gemini-2.5-flash | medium | |
https://generativelanguage.googleapis.com |
gemini-2.5-pro | default, low, high | |
https://api.moonshot.ai/v1 |
kimi-k2.5 | default |
任何提供 OpenAI 兼容 HTTP API 的模型均可使用,包括通过 Ollama、LM Studio 或 vLLM 本地部署的模型。
您可以配置最多 10 个服务商组,每组包含多个模型,从而:
对于支持的模型,您可以为每次请求设置推理等级:default、low、medium、high 或 xhigh,用于控制模型在回答前的思考深度。
其他可调参数:
| 参数 | 说明 | 默认值 |
|---|---|---|
| Temperature | 控制输出随机性(0 = 确定性,2 = 创意性) | 1.0 |
| 最大输出 Token 数 | 限制模型回复长度 | 2048 |
| 输入 Token 上限 | 限制发送给模型的上下文大小 | 模型默认值 |
| 系统提示词 | 每次请求前置的自定义指令 | — |
首条消息会将整篇论文作为上下文加载,后续问题则通过检索定位相关段落,保持对话快速且精准。
插件支持三种对话模式:
| 模式 | 说明 |
|---|---|
| 论文对话 | 针对当前打开的 PDF 进行对话,上下文来自该论文。 |
| 全局对话 | 覆盖整个文库的对话,不限定于某篇论文。 |
| 笔记对话 | 编辑 Zotero 笔记时进行对话,以笔记内容为上下文。 |

提问时,模型会生成基于论文内容的答案,每条结论均附有引用——点击即可跳转到 PDF 中的原始段落,方便核实答案并快速定位相关章节。

数秒内为任意论文生成简洁摘要。摘要基于完整 PDF 全文生成,您可以自定义提示词,聚焦于研究方法、结果、启示或其他任何方面。

选中 PDF 中任意复杂段落或专业术语,请模型为其解释。您最多可添加 5 条上下文(来自论文或之前的回答)以进一步细化解释。
可选弹窗会自动建议将选中文本添加到对话,不喜欢可在设置中关闭。

截取任意图形、图表或示意图,请模型进行解读。每次最多支持 10 张截图,适合分析复杂的多面板图表或跨章节对比视觉内容。

在不同标签页中打开多篇论文,并排对比。在输入框中输入 / 可引用其他已打开的论文作为额外上下文,单次对话最多可引用 10 篇论文,实现深度跨文献分析。

从本地磁盘上传文档作为额外上下文,支持格式:

一键将任意回答或选中文本直接保存到 Zotero 笔记,与您现有的笔记工作流无缝集成,无需手动复制粘贴。

对话会自动保存到本地并与对应论文关联。您可以:

创建最多 10 个自定义预设,将常用提示词一键触发。内置预设包括:
您可以修改这些预设或添加自定义内容,以适配您的研究工作流。

在独立窗口中打开 LLM 助手,脱离 Zotero 阅读器侧栏。独立窗口提供全尺寸聊天界面,左侧配有可折叠的对话历史面板。
| 方式 | 操作 |
|---|---|
| 快捷键 | Ctrl+Shift+L(macOS:Cmd+Shift+L) |
独立窗口打开时,阅读器侧栏面板会显示占位提示,提供聚焦窗口(将独立窗口置于前台)和关闭窗口并返回侧栏两个选项。
除了 Zotero 内置笔记外,Agent 还可以将研究笔记保存为您指定本地目录中的 Markdown 文件。插件不绑定任何特定笔记软件:可以指向 Obsidian 知识库、Logseq 图谱,或普通 .md 文件夹。
打开 首选项 → llm-for-zotero,滚动到 Notes Directory 部分。

| 设置项 | 说明 | 示例 |
|---|---|---|
| Nickname | 在聊天中称呼该目录的名称;当您提到这个名称时,Agent 会识别它 | Obsidian、Logseq |
| Notes Directory Path | 保存笔记的根目录绝对路径 | /Users/me/MyVault |
| Default Folder | 新笔记默认写入的子文件夹;如果您明确要求,Agent 也可以写入其他文件夹 | Logs |
| Attachments Folder | 复制图表和图片的目录,相对于笔记目录根路径 | Logs/imgs |
点击 Test Write Access 验证插件是否有权限写入该目录。
使用您配置的昵称要求 Agent 写笔记,例如“总结这篇论文并保存到 Obsidian” 或 “把这篇记录到我的 Logseq”。Agent 将:
write-note 技能中的约定。write-note 模板中的 title、created、tags、citekey、doi、journal;作者信息保留在正文中。{notes_directory}/{default_folder}/{title}.md。
笔记使用 Pandoc 引用语法([@citekey]),兼容 Obsidian 的 Zotero Integration 和 Pandoc 插件,也适用于大多数 Markdown 阅读器。
write-note 技能中。打开独立窗口中的 Skills 面板即可自定义。
启用后,LLM 将成为一个自主 Agent,可在 Zotero 文库中执行读取、搜索和写入操作。读取工具可直接运行;写入工具会进入确认卡片,并支持撤销。
这些工具让 Agent 浏览您的文库、PDF、附件和在线学术资源,不会修改任何内容。
| 工具 | 说明 |
|---|---|
query_library |
发现 Zotero 条目和文集:搜索或列举任意条目类型,可按作者、年份、文集、条目类型或标签筛选,浏览文集树,查找相关论文和重复项 |
read_library |
读取一个或多个条目的结构化状态:元数据、笔记、注释、附件和文集归属 |
read_paper |
读取 PDF 文本内容,默认读取开篇章节,也可指定章节索引;单次最多 20 篇论文 |
search_paper |
通过问题在论文中查找证据,返回排序后的相关段落;单次最多 10 篇论文 |
view_pdf_pages |
将 PDF 页面渲染为图像,支持按问题、页码或当前阅读器视图捕获,用于视觉分析 |
read_attachment |
按 Zotero 附件 ID 读取 HTML 快照、文本文件、图片等附件,或将整个文件发送给模型 |
search_literature_online |
从 CrossRef、Semantic Scholar 等在线学术源搜索元数据、推荐、参考文献和引用 |
所有写入工具均需人工确认后方可生效。
| 工具 | 说明 |
|---|---|
apply_tags |
为一篇或多篇论文添加或移除标签 |
update_metadata |
更新标题、作者、DOI、期刊、摘要等元数据字段 |
move_to_collection |
将论文加入或移出文集 |
manage_collections |
创建或删除文集 |
manage_attachments |
删除、重命名或重新链接损坏的附件文件路径 |
merge_items |
合并重复条目:保留主条目,将子项从其他条目移入,并将重复项移至回收站 |
trash_items |
将条目移至回收站 |
import_identifiers |
通过 DOI、ISBN、arXiv ID 或 URL 导入论文 |
import_local_files |
从本地导入文件到 Zotero;Zotero 会为可识别 PDF 自动抓取元数据 |
edit_current_note |
编辑当前 Zotero 笔记,或用纯文本、Markdown、HTML 创建新笔记 |
undo_last_action |
撤销本次对话中最近一次已确认的写入操作 |
Agent 包含面向本地文件、脚本和 Zotero 运行时自动化的系统级工具。
| 工具 | 说明 |
|---|---|
file_io |
读写本地文件系统中的文本和图片文件,支持 offset/length 局部读取 |
run_command |
在本地机器上执行 Shell 命令(macOS 使用 zsh,Linux 使用 bash,Windows 使用 cmd.exe),适合分析脚本和命令行工具 |
zotero_script |
在 Zotero 运行时内部执行 JavaScript;读取模式用于批量取数,写入模式用于自定义变更 |
典型使用场景:
pandoc、ffmpeg、pdftotext)作为 Agent 工作流的一部分。Agent 为常见文库管理工作流提供高级动作,自动串联多个工具。
| 动作 | 功能说明 |
|---|---|
| 文库审计 | 扫描整个文库或某个文集中元数据不完整、缺少 PDF、缺少标签等问题,并可将报告保存为 Zotero 笔记 |
| 自动标签 | 为当前论文、已选择论文、已选择文集或整个文库推荐标签,并打开可编辑的批量标签审阅对话框 |
| 补全元数据 | 审计目标论文缺失的书目信息,从外部源获取规范元数据,并通过一个审阅卡片确认更新 |
| 发现相关文献 | 通过推荐、参考文献或被引关系查找相关论文 |
| 整理未归档条目 | 查找未归档条目,通过交互式审阅流程归入文集 |
| 文献综述 | 启动引导式文献综述工作流 |
| 文库统计 | 汇总文库或文集的条目类型、年份、作者、期刊、文集、标签、注释和增长趋势等统计信息 |
插件运行内置的 Model Context Protocol (MCP) 服务器,允许外部 AI Agent 和工具以编程方式与您的 Zotero 文库交互。
http://localhost:23119/llm-for-zotero/mcpinitialize、tools/list、tools/call这意味着您可以将任何兼容 MCP 的 AI Agent(如 Claude Desktop、Cursor、自定义 Agent)连接到您的 Zotero 文库,使用上述所有工具。
Agent 可以串联多个工具完成复杂任务——例如查找论文、读取元数据、搜索相关文献并撰写摘要笔记。






所有写入操作均通过人机协作确认流程:
undo_last_action 进行撤销。
Skills(技能)是可自定义的引导文件,用于调整 Agent 处理不同类型请求的方式。每个技能是一个 Markdown 文件,包含正则表达式触发模式:当您的消息匹配某个技能的模式时,该技能的指令会自动注入 Agent 的系统提示词中,引导它使用最高效的工具和工作流来完成任务。
插件内置 8 个技能,覆盖常见的研究工作流。首次运行时会自动复制到您的技能文件夹。
| 技能 | 触发场景 | 引导 Agent 执行的操作 |
|---|---|---|
simple-paper-qa |
关于论文的一般性问题(摘要、发现、作者、TLDR) | 读取论文一次后直接回答,避免不必要的检索调用 |
evidence-based-qa |
关于具体方法、结果、数据或论断的问题 | 先读取论文,再通过定向 search_paper 检索特定证据 |
analyze-figures |
按编号引用图表、表格或示意图 | 优先使用 MinerU 缓存图像,并将图像直接发送给模型分析 |
compare-papers |
比较或对比多篇论文的请求 | 批量读取论文,再针对比较要点检索证据 |
library-analysis |
总结、分析或审计整个文库的请求 | 使用高效脚本遍历文库条目,而非通过上下文分页 |
literature-review |
文献综述或研究综合的请求 | 发现论文、深度阅读最相关的几篇,并按主题综合 |
write-note |
写作阅读笔记、Zotero 笔记或笔记目录 Markdown 文件的请求 | 生成带元数据、Pandoc 引用和可选图表复制的笔记 |
import-cited-reference |
导入当前 PDF 中引用文献的请求 | 提取参考文献,并将选中的引用论文导入 Zotero |
match 模式进行匹配。Ctrl+Shift+L / macOS:Cmd+Shift+L)。---
id: my-custom-skill
match: /你的正则表达式模式/i
match: /另一个触发模式/i
---
当此技能匹配时,Agent 应遵循的指令。
描述工作流程、优先使用哪些工具以及任何约束条件。
技能文件格式:
| 字段 | 必需 | 说明 |
|---|---|---|
id |
是 | 技能的唯一标识符 |
match |
是(至少一个) | 正则表达式模式,支持可选标志(i、g、m 等)。可重复——多个 match 行使用 OR 语义 |
| 指令正文 | 是 | 结束标记 --- 之后的 Markdown 文本。技能匹配时会注入 Agent 的系统提示词 |
.md 文件形式存储在 {Zotero数据目录}/llm-for-zotero/skills/ 中。.md 文件与他人分享自定义技能。将技能文件放入您的技能文件夹,在下次插件启动或在面板中创建/删除任何技能后即会被加载。
WebChat 模式通过浏览器扩展将您的问题直接发送到 chatgpt.com——无需 API 密钥。查询从 Zotero 转发到 ChatGPT 网页界面,回复实时流式传回插件。
1. 下载浏览器扩展:
前往 github.com/yilewang/sync-for-zotero → Releases,下载最新的 sync-for-zotero-extension.zip,解压到电脑上的文件夹。
2. 安装扩展(侧载):
chrome://extensions3. 配置插件:
打开 Zotero → 首选项 → llm-for-zotero:
| 设置项 | 值 |
|---|---|
| 认证模式 | WebChat |
| 模型 | (自动设为 chatgpt.com) |
4. 开始对话:
在浏览器中打开一个 ChatGPT 标签页并保持打开。在 Zotero 中,插件面板会显示 “chatgpt.com” 指示器及连接状态点(绿色 = 已连接,红色 = 未检测到)。输入问题并发送即可。
/)和引用选择器(@)。如果您拥有 ChatGPT Plus 订阅,可以通过 Codex CLI 登录,在插件中免单独 API 密钥使用 gpt-5.4 等 Codex 模型。
插件现在提供两种 Codex 相关模式。新用户应选择 Codex App Server。
codex app-server CLI,并通过 stdio 与其通信。这是第三方应用使用 Codex 的官方方式,也是新用户首选配置。Codex App Server。特别感谢 @jianghao-zhang 贡献最初的 Codex Auth 集成,以及 @boltma 设计 Codex App Server 集成。
1. 安装 Codex CLI(一次性操作):
# macOS / Linux(需要 Node.js 18+)
npm install -g @openai/codex
# macOS 替代方案(无需 Node.js)
brew install --cask codex
2. 登录 ChatGPT 账号:
codex login
浏览器窗口将自动打开——使用您的 ChatGPT Plus 账号登录。凭据保存至 ~/.codex/auth.json。
3. 配置插件:
在 Zotero → 首选项 → llm-for-zotero 中:
| 设置项 | 推荐值 |
|---|---|
| 认证模式 | Codex App Server |
| API 地址 | 留空 |
| 模型 | 例如 gpt-5.4 |
点击测试连接以验证。
仍需旧方式的现有用户可以选择 Codex Auth (Legacy),API 地址保持 https://chatgpt.com/backend-api/codex/responses,模型名称保持不变。

~/.codex/auth.json(或 $CODEX_HOME/auth.json)读取本地凭据。/files 上传流程。MinerU 是一款先进的 PDF 解析引擎,可从 PDF 中提取高保真 Markdown,同时保留表格、公式、图表和复杂版式——这些内容在标准文本提取中往往会被破坏。

启用后,插件会将 PDF 发送到 MinerU API 进行解析并在本地缓存结果。此后与该论文的所有交互都将使用 MinerU 解析的内容,为模型提供更丰富、更准确的上下文。
插件提供共享社区代理,开箱即用无需 API 密钥,但共享配额有限。如需更大用量:
提供个人 API 密钥后,插件将直接调用 https://mineru.net/api/v4。未提供密钥时,使用社区代理。
是否免费使用?
是的,插件完全免费且开源(AGPL v3)。您只需为调用所选服务商的 API 付费。使用 Codex App Server 认证时,ChatGPT Plus 订阅用户无需单独 API 密钥。
是否支持本地模型?
支持——任何提供 OpenAI 兼容 HTTP API 的模型均可使用,包括通过 Ollama、LM Studio、vLLM 等工具本地部署的模型。在设置中填写本地 API 地址和模型名称即可。
我的数据是否会用于训练模型?
不会。您使用自己的 API 密钥,数据隐私由您所选服务商的条款约束。大多数 API 服务商(如 OpenAI、Anthropic)不会将 API 数据用于模型训练。
能否同时使用多个模型?
可以。配置最多 10 个服务商组,每组包含多个模型,通过模型选择器在对话中随时切换。
上下文检索是如何工作的?
首条消息会加载论文全文作为上下文,后续问题使用混合检索(BM25 + 嵌入向量搜索)并结合多样性优化,定位最相关段落,保持响应快速准确。
如何报告 Bug 或提交功能请求?
请在 GitHub 上 提交 Issue。
欢迎贡献!无论是 Bug 反馈、功能请求还是 Pull Request——欢迎在 GitHub 上提交 Issue 或 PR。
如果本插件对您有帮助,欢迎:
