小智头像图片
AI动态资讯 2025年02月12日
0 收藏 0 点赞 352 浏览 1861 个字
摘要 :

精准度提升新路径:谷歌Vertex AI推出企业级RAG引擎: Vertex AI RAG Engine 是一项托管的编排服务,旨在简化大语言模型与外部数据源的连接,它能够帮助模型保持数据更……

哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“精准度提升新路径:谷歌Vertex AI推出企业级RAG引擎”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。

精准度提升新路径:谷歌Vertex AI推出企业级RAG引擎

精准度提升新路径:谷歌Vertex AI推出企业级RAG引擎:

Vertex AI RAG Engine 是一项托管的编排服务,旨在简化大语言模型与外部数据源的连接,它能够帮助模型保持数据更新,生成更贴合需求的答案,并有效减少幻觉。

根据谷歌的说法,新的 RAG Engine 是使用 Vertex AI 实现基于 RAG 的 LLM 的“理想选择”,它在 Vertex AI Search 的易用性与基于底层 Vertex AI API(如文本嵌入 API、排名 API 等)构建自定义 RAG 管道的强大功能之间取得了平衡。

Vertex AI RAG Engine 支持的总体工作流包含了从多种不同来源摄取数据的步骤:数据转换,例如在索引之前将数据拆分为块;嵌入处理,将文本转换为数值向量,以捕捉其语义和上下文;数据索引,构建针对搜索进行了优化语料库;基于用户提示词从知识库中检索相关信息;最后是生成内容,将原始用户查询与检索到的信息结合,生成最终输出。

使用 Vertex AI RAG Engine,你可以很容易地将所有这些步骤集成到自己的解决方案中。集成 Vertex AI RAG Engine 最简单的方式是使用它的 Python 绑定 ,这些绑定位于 google-cloud-aiplatform 包中。在设置 Google Cloud 项目并初始化 Vertex AI 引擎后,你可以使用 upload_file 或 import_file 方法快速从本地文件、Google Cloud Storage 或 Google Drive 中的文档创建语料库。

# Currently supports Google first-party embedding models
EMBEDDING_MODEL = “publishers/google/models/text-embedding-004″ # @param {type:”string”, isTemplate: true}
embedding_model_config = rag.EmbeddingModelConfig(publisher_model=EMBEDDING_MODEL)

rag_corpus = rag.create_corpus(
display_name=”my-rag-corpus”, embedding_model_config=embedding_model_config
)

rag_file = rag.upload_file(
corpus_name=rag_corpus.name,
path=”test.txt”,
display_name=”test.txt”,
description=”my test file”,
)

在有了语料库之后,你就可以创建一个检索工具,然后将其连接到 LLM,并暴露出端点,你可以使用该端点查询增强后的模型:

# Create a tool for the RAG Corpus
rag_retrieval_tool = Tool.from_retrieval(
retrieval=rag.Retrieval(
source=rag.VertexRagStore(
rag_corpora=[rag_corpus.name],
similarity_top_k=10,
vector_distance_threshold=0.5,
),
)
)

# Load tool into Gemini model
rag_gemini_model = GenerativeModel(
“gemini-1.5-flash-001”, # your self-deployed endpoint
tools=[rag_retrieval_tool],
)

response = rag_gemini_model.generate_content(“What is RAG?”)

根据谷歌的说法,Vertex AI RAG Engine 特别适合用于个性化投资建议与风险评估、加速药物发现与个性化治疗计划制定,以及增强尽职调查和合同审查等场景。

检索增强生成(RAG)是一种用于 “锚定” 大语言模型的技术,即使其更适合特定用例或企业环境。RAG 的核心是从模型训练时无法访问的外部数据源中检索与特定任务相关的信息,并将这些信息与提示词一起提供给模型。或者也可以通过微调来“锚定”模型,这是一个使用外部数据重新训练模型的过程,即使在提示词中未明确指定,模型也能在每次查询时提供更贴合需求的结果。

锚定模型使其能够更好地理解查询的上下文,并提供额外特定于任务的信息,从而生成更好的答案。更具体地说,在企业数据场景中,锚定旨在通过安全地提供防火墙内的私有数据来克服 LLM 的局限性。

嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“精准度提升新路径:谷歌Vertex AI推出企业级RAG引擎”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!

微信打赏二维码 微信扫一扫

支付宝打赏二维码 支付宝扫一扫

版权: 转载请注明出处:https://www.ai-blog.cn/3807.html

相关推荐

Claude Code 工具现严重漏洞:或致系统“变砖”: 3 月 7 日消息,Anthropic 近期发布的编码工具 Cla…

小智头像图片
77

最新全球AI应用排行:DeepSeek 名列第二: 3 月 7 日,全球著名投资基金、咨询公司 Andreessen Hor…

小智头像图片
105

火山引擎部分模型降价50%,百度上调DeepSeek价格: 3 月 6 日,据网友反馈,火山引擎向用户发送通…

小智头像图片
148

Manus 紧急扩容服务器,口碑两极分化: 3 月 6 日,一款 AI 产品突然火爆社交圈,诸多文案以“比肩 …

小智头像图片
99

欧洲「DeepSeek」发布了全世界最好的 OCR: 就在刚刚,那个曾经开源了首个 MoE 模型的欧洲初创公司…

小智头像图片
47

被骂惨的“现象级”Manus,今天我们来扒一扒它的水平!: 昨天,一款由中国团队发布的 Agent 产品 Man…

小智头像图片
152

代码界的“瘟疫”?卡帕西“氛围编码”兴起: “有一种全新的编码方式,我称之为“vibe coding”(氛围编…

小智头像图片
69

Arm发布全新Armv9边缘AI计算平台: 近日,Arm 正式发布了其全球首款 Armv9 边缘 AI 计算平台。据介…

小智头像图片
163
发表评论
暂无评论

还没有评论呢,快来抢沙发~

助力原创内容

快速提升站内名气成为大牛

扫描二维码

手机访问本站

二维码
vip弹窗图片