Khoj(科霍)AI搜索引擎深度评测:开源个人知识库智能搜索与问答平台使用教程:从入门到精通
从选型到落地的可执行指南,适合个人与团队快速上手。
教程正文
从选型到落地的实战步骤。
前言
你是否曾经因为笔记散落在不同文件、文件夹中而找不到关键信息?Khoj(科霍)是一款开源的AI搜索引擎,专门为个人知识库设计,支持本地Markdown、PDF、Org-mode等文件,通过自然语言进行智能搜索和问答。本教程将带你从零开始部署Khoj,并掌握其核心功能,让你的知识库真正“活”起来。

第一步:安装与部署
方式一:Docker快速部署(推荐)
Docker是最简单的方式,适合大多数用户。
- 确保已安装Docker和Docker Compose。
- 创建一个目录存放配置文件:
mkdir ~/khoj && cd ~/khoj - 下载官方docker-compose.yml:
wget https://raw.githubusercontent.com/debanjum/khoj/master/docker-compose.yml - 修改环境变量,设置你的OpenAI API密钥(或使用本地模型)。编辑
docker-compose.yml,找到KHOJ_OPENAI_API_KEY,替换为你的密钥。 - 启动服务:
docker-compose up -d - 访问
http://localhost:42110即可看到Khoj Web界面。

技巧Tip: 如果你担心数据隐私,可以使用本地模型(如Llama、GPT4All),在docker-compose.yml中设置KHOJ_OPENAI_API_BASE指向本地推理端点,并关闭外部API调用。
方式二:本地Python安装(高级用户)
需要Python 3.9+。
- 克隆仓库:
git clone https://github.com/debanjum/khoj.git && cd khoj - 安装依赖:
pip install -r requirements.txt - 配置环境变量:
export KHOJ_OPENAI_API_KEY=your_key - 运行:
python khoj/web/main.py
第二步:配置知识库
Khoj需要知道你的文件在哪里。编辑配置文件 khoj.yml(位于当前目录或配置目录)。
content-type:
markdown:
input-files:
- ~/Documents/Notes
- ~/obsidian/vault
pdf:
input-files:
- ~/Documents/PDFs
plaintext:
input-files:
- ~/vimwiki
Khoj支持Markdown、PDF、Org-mode、Plaintext等格式。你可以指定多个目录。
技巧Tip: 如果文件数量很大,先在khoj.yml中设置max-file-size限制大小,避免索引过慢。

第三步:索引知识库
配置完成后,需要构建索引。
- 在Web界面点击“Index”按钮,或命令行运行:
python khoj/index.py - 首次索引可能需要几分钟,取决于文件数量。Khoj会将文档分割成chunk并生成嵌入向量。
- 索引完成后,状态变为“Ready”。
技巧Tip: 如果你添加了新文件,无需重新全量索引,Khoj支持增量更新。只需再次点击“Index”即可。
第四步:智能搜索与问答
基本搜索
在搜索框中输入关键词,例如“项目管理方法论”,Khoj会返回相关片段,并高亮匹配关键词。注意,Khoj不仅做关键词匹配,还利用语义理解找到含义相似的段落。
自然语言问答
Khoj的杀手锏是问答功能。输入类似“我在哪份文档中讨论过敏捷开发的优势?” Khoj会直接给出答案并注明来源文件。
操作步骤:
- 点击右侧的“Ask”图标,进入问答模式。
- 输入问题,如“我的笔记里关于Python装饰器的内容有哪些?”
- Khoj会基于索引的文档生成回答,并引用原文片段。
技巧Tip: 问答质量取决于模型。使用GPT-4效果最佳,但费用较高。如果使用本地模型,建议选择Llama-2-13B或更高,以获得稍好的结果。
第五步:高级功能与自定义
使用本地模型(离线)
Khoj支持通过KHOJ_OPENAI_API_BASE连接本地推理服务,例如使用llama.cpp或Ollama。配置后,所有搜索和问答都在本地完成,无需联网。
自定义搜索权重
在khoj.yml中,可以调整不同字段的搜索权重,例如提高标题权重:weight-title: 3
集成到Obsidian或Emacs
Khoj提供浏览器插件和Emacs插件。安装后,可以在编辑器中直接搜索个人知识库。
- Obsidian插件:搜索社区插件“Khoj”即可安装。
- Emacs用户:通过MELPA安装
khoj包。
常见问题与排错
Q:索引后搜索结果为空?
检查khoj.yml中的input-files路径是否正确,文件是否可读。另外,确认索引过程没有报错。
Q:问答时总是返回“无法回答”?
可能是问题涉及的文档不在索引中,或者AI模型回答阈值设置过高。可以降低min-response-length或检查是否有相关文档。
总结
Khoj是一个强大的开源个人知识库搜索引擎,它结合了语义搜索和AI问答,让你的笔记和文档真正变得可搜索、可交互。从Docker部署到日常搜索,本教程覆盖了关键步骤。现在就去试试,把散落的智慧串联起来吧!
最终技巧Tip: 定期备份你的khoj.yml和索引文件(默认在~/.khoj/),方便迁移。
相关教程推荐
继续学习相关主题。
秘塔AI搜索(Metaso)深度评测:无广告的智能搜索引擎与知识发现平台使用教程:从入门到精通
秘塔AI搜索(Metaso)是一款无广告、基于大模型的智能搜索引擎,本文从注册、基础搜索、深度模式、学术搜索、文件分析到知识库管理,提供完整可操作的入门与进阶教程。
通义千问(Tongyi Qianwen)深度评测:2025年国产多模态大语言模型的智能对话旗舰使用教程:从入门到精通
2025年通义千问升级了多模态、128K上下文和联网搜索。本文从注册到进阶,手把手教你用图片分析、文档解析、代码调试等功能,附实用模板与避坑指南。
Amazon Q Developer(亚马逊Q开发者)深度评测:AWS生态下的智能编程与云服务助手使用教程:从入门到精通
本教程从零开始讲解Amazon Q Developer的安装、配置与核心功能,包括代码补全、调试、安全扫描及AWS云服务咨询,配有实操步骤与技巧,适合初学者快速掌握AWS智能编程助手。
Pixverse(像素宇宙)AI视频生成工具深度评测:创意无限的文生视频与图生视频新选择使用教程:从入门到精通
全方位解锁Pixverse文生图与图生视频核心功能,从注册到高阶技巧,涵盖提示词工程、参数调优及实战案例,助你快速产出高质量AI视频。