小智头像图片
AI教程 2025年02月14日
0 收藏 0 点赞 143 浏览 2613 个字
摘要 :

使用DeepSeek+RAG实现私人知识库: 本文详细介绍了如何利用Ollama和AnythingLLM工具在本地部署DeepSeek模型,并构建私人SAP知识库。操作步骤包括:1)安装Ollama并运行D……

哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“使用DeepSeek+RAG实现私人知识库”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。

使用DeepSeek+RAG实现私人知识库

使用DeepSeek+RAG实现私人知识库:

本文详细介绍了如何利用Ollama和AnythingLLM工具在本地部署DeepSeek模型,并构建私人SAP知识库。操作步骤包括:1)安装Ollama并运行DeepSeek模型;2)上传SAP文档作为知识库素材;3)使用AnythingLLM创建工作区并集成DeepSeek;4)通过向量数据库嵌入文档,实现基于文档的智能问答。最终,用户可通过AnythingLLM与DeepSeek交互,获取基于上传文档的精准回答。本文还提到企业级用户可通过私有部署提升数据安全性和响应速度,个人用户则可选择云服务(如腾讯云HAI)进行低成本尝试。

实现工具与操作步骤
1.安装Ollama并运行 DeepSeek

Ollama 是一个用于在本地环境运行大语言模型的工具。它允许开发者在本地 GUI 或者命令行加载和运行各种 AI 模型,而无需深入理解底层的机器学习框架。

Ollama 设计思路类似于 Docker,通过它管理的 AI 模型类似于 Docker Image,但 Ollama 专门针对 AI 模型进行了优化。

使用DeepSeek+RAG实现私人知识库

Ollama 安装成功之后,使用命令行 ollama run deepseek-r1:1.5b, 这个命令会自动下载 DeepSeek 模型到 HAI 并运行。1.5b 意思是下载参数个数为 15 亿的 DeepSeek 版本,为了节省时间,笔者选择了这个文件尺寸为 1.1 GB 的最精简的模型。

使用DeepSeek+RAG实现私人知识库

耐心等待下载结束,看到命令行里弹出 think 提示符,输入 who are you? 得到 DeepSeek 的自我介绍回复,说明 Ollama 和自动下载的 DeepSeek R1 已经正常工作了。

2.上传 SAP 文档作为知识库素材

既然是打造私人的 SAP 知识库, 我们就需要给 DeepSeek 喂一些外部文档作为知识库的文档素材。

在 Bing 搜索引擎里使用 site:sap.com filetype: pdf 随便搜一些 SAP 官方发布的 PDF 来测试。在实际使用场景中,企业级客户可以将自己的私密数据,喂给本地部署的大模型,而不用担心隐私泄漏的问题。

使用DeepSeek+RAG实现私人知识库

这里我从 Bing 的搜索结果下载了一个名叫 SAP S4HANA private cloud – implementation guide.pdf 的文件。

使用DeepSeek+RAG实现私人知识库

3.使用AnythingLLM建立工作区

下一步,下载 AnythingLLM 并安装。

AnythingLLM 是一个开源的 AI 工具,能够方便地将用户提供的各种格式的文档,嵌入到自定义 AI 模型中,使其在同用户对象中作为可参考上下文的一部分。这意味着通过 AnythingLLM, AI 模型在回答问题时,可以检索和分析用户提供的文档,将其内容整合作为最终的输出,即本文开头部分介绍的 RAG 工作方式。

使用DeepSeek+RAG实现私人知识库
使用DeepSeek+RAG实现私人知识库

AnythingLLM 安装完毕之后,像使用 ABAP Development Tool 一样,新建一个工作区(Workspace):

使用DeepSeek+RAG实现私人知识库

点击「聊天设置」:

使用DeepSeek+RAG实现私人知识库

还记得我们刚才下载的 Ollama 和通过 ollama run 命令下载的 DeepSeek R1 吗?在工作区 LLM 提供者的下拉菜单中,找到通过 Ollama 管理的 DeepSeek R1。

这个设置的意思是,我们接下来可以通过 AnythingLLM 提供的 GUI 窗口,同 DeepSeek 对话,可以同 Ollama 自带的命令行窗口说再见了。

使用DeepSeek+RAG实现私人知识库

4.文档嵌入与向量数据库

接下来通过向量数据库来上传并存储用户提供的文档。点击上传图标,打开上传对话框:

使用DeepSeek+RAG实现私人知识库

点击 Upload 区域,将刚才从 Bing 搜索下载的 SAP S/4HANA private cloud PDF 文档上传:

使用DeepSeek+RAG实现私人知识库

待文档上传完毕,点击 Save and Embed 按钮,将文档内容转换成向量数据并执行嵌入操作。

使用DeepSeek+RAG实现私人知识库

向量数据库是一种用于存储和查询高维向量数据的数据库,其核心功能是提供高效的相似度搜索,使得查询向量能够找到与之最接近的向量。相比传统关系型数据库(如 MySQL、PostgreSQL),向量数据库更适合存储和检索非结构化数据,如文本、图像、音频等。

在 RAG 架构中,向量数据库的作用类似于一个知识库,它存储了大量文本片段的嵌入(Embeddings),当用户输入查询时,模型会将查询转换为向量,并在数据库中检索最相关的向量,进而找到对应的文本内容。这种方式大幅提高了生成式 AI 的可控性和可解释性。

使用DeepSeek+RAG实现私人知识库

文档嵌入(Embedding)是将文本数据转换为向量的过程。这一过程的核心是将文本内容映射到一个高维向量空间中。相似的文本在该空间中的距离较近,而不相关的文本距离较远。

当然在实际企业级应用中,除了小规模的人工手动上传文档外,AnythingLLM 也支持通过 Data Connection 进行批量上传大规模文档,比如批量上传某个 Github Repo 里的文件。这种模型下,AnythingLLM 读取 Github 仓库内容的方式,通过 Access Token 完成。

使用DeepSeek+RAG实现私人知识库

等我们上传的文件出现在工作区右边区域后,说明文档的向量化即嵌入操作已经完成。

使用DeepSeek+RAG实现私人知识库

效果验证

此时,我们回到 AnythingLLM 同 DeepSeek 的对话窗口,提出一个问题:

What is embedded EWM?

使用DeepSeek+RAG实现私人知识库

DeepSeek 给出的回答的确是基于我们刚刚上传的 PDF 文件来完成的。

这一点可以从 DeepSeek 回复的 Citation 即引用区域得到证实,该区域显示本次回答引用了 SAP S4HANA private cloud edition.pdf 这个文件。

后记:模型部署

对于企业级用户而言,大模型的私有部署,在数据安全性、响应速度、可定制化、长期成本以及可靠性等多个方面都有着显著优势。而对于个人 AI 学习者来说,可以选择本地部署或者在某个云服务提供商的基础设施(IaaS)上进行私有部署的尝试。

笔者现在使用的笔记本电脑,本地部署满血 DeepSeek 比较吃力。所以,我选择了腾讯云 HAI,这样就不用自己掏钱升级硬件了。

你可以登录腾讯 HAI 控制台,新建一个 Windows Server 实例:

使用DeepSeek+RAG实现私人知识库

使用 Windows 自带的 Remote Desktop Connection 登录到创建好的 HAI 实例上。

使用DeepSeek+RAG实现私人知识库

笔者之前曾发布过文章使用腾讯 HAI 5 分钟内部署一个私人定制的 DeepSeek,详细介绍了采用私有部署方式运行 DeepSeek 的步骤,有兴趣的小伙伴可前往了解。

通过本文展示的步骤,即使是一个不了解大语言模型底层实现细节的普通用户,借助 Ollama 和 AnythingLLM 这两个工具,也能轻松完成 DeepSeek 的本地部署,并打造自己的私人知识库。

嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“使用DeepSeek+RAG实现私人知识库”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!

微信打赏二维码 微信扫一扫

支付宝打赏二维码 支付宝扫一扫

版权: 转载请注明出处:https://www.ai-blog.cn/3930.html

相关推荐
03-09

全新 Cursor 编程工作流程,让开发变得更简单高效: Cursor 迎来全新升级!这次优化提升了 AI 辅助…

小智头像图片
153
02-22

kimiAI教程小红书生成运营方案: 生成运营方案 接下来,我让它结合前面账号信息和爆款笔记信息,进…

小智头像图片
143
02-22

kimiAI教程小红书爆款笔记分析: 爆款笔记分析 继续回到对标账号页面,现在我们来分析爆款笔记,直…

小智头像图片
143
02-22

kimiAI教程小红书账号拆解与分析: 账号拆解与分析 打开对标账号首页,调出Kimi阅读助手插件,发送…

小智头像图片
143
02-22

KimiChat提示词教程之长上下文提示词(5): 二、长上下文提示词(35个) 28、编程顾问prompt 适用…

小智头像图片
143
02-22

KimiChat提示词教程之长上下文提示词(4): 二、长上下文提示词(35个) 20、会议助手Prompt 适用…

小智头像图片
143
02-22

KimiChat提示词教程之长上下文提示词(3): 二、长上下文提示词(35个) 14、文案创作Prompt 适用…

小智头像图片
143
02-21

KimiChat提示词教程之长上下文提示词(2): 二、长上下文提示词(35个) 8、新闻简讯快写Prompt …

小智头像图片
143
发表评论
暂无评论

还没有评论呢,快来抢沙发~

助力原创内容

快速提升站内名气成为大牛

扫描二维码

手机访问本站

二维码
vip弹窗图片