面向开发者的LLM入门教程-聊天Chat:定义聊天机器人: 定义一个适用于您文档的聊天机器人 通过上述所学内容,我们可以通过以下代码来定义一个适用于私人文档的聊天机器人……
哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“面向开发者的LLM入门教程-聊天Chat:定义聊天机器人”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。
面向开发者的LLM入门教程-聊天Chat:定义聊天机器人:
定义一个适用于您文档的聊天机器人
通过上述所学内容,我们可以通过以下代码来定义一个适用于私人文档的聊天机器人:
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.text_splitter import CharacterTextSplitter,
RecursiveCharacterTextSplitter
from langchain.vectorstores import DocArrayInMemorySearch
from langchain.document_loaders import TextLoader
from langchain.chains import RetrievalQA, ConversationalRetrievalChain
from langchain.memory import ConversationBufferMemory
from langchain.chat_models import ChatOpenAI
from langchain.document_loaders import TextLoader
from langchain.document_loaders import PyPDFLoader
def load_db(file, chain_type, k):
“””
该函数用于加载 PDF 文件,切分文档,生成文档的嵌入向量,创建向量数据库,定义检索器,并创建聊
天机器人实例。
参数:
file (str): 要加载的 PDF 文件路径。
chain_type (str): 链类型,用于指定聊天机器人的类型。
k (int): 在检索过程中,返回最相似的 k 个结果。
返回:
qa (ConversationalRetrievalChain): 创建的聊天机器人实例。
“””
# 载入文档
loader = PyPDFLoader(file)
documents = loader.load()
# 切分文档
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000,
chunk_overlap=150)
docs = text_splitter.split_documents(documents)
# 定义 Embeddingsembeddings = OpenAIEmbeddings()
# 根据数据创建向量数据库
db = DocArrayInMemorySearch.from_documents(docs, embeddings)
# 定义检索器
retriever = db.as_retriever(search_type=”similarity”, search_kwargs={“k”: k})
# 创建 chatbot 链,Memory 由外部管理
qa = ConversationalRetrievalChain.from_llm(
llm=ChatOpenAI(model_name=llm_name, temperature=0),
chain_type=chain_type,
retriever=retriever,
return_source_documents=True,
return_generated_question=True,
)
return qa
import panel as pn
import param
# 用于存储聊天记录、回答、数据库查询和回复
class cbfs(param.Parameterized):
chat_history = param.List([])
answer = param.String(“”)
db_query = param.String(“”)
db_response = param.List([])
def __init__(self, **params):
super(cbfs, self).__init__( **params)
self.panels = []
self.loaded_file = “docs/matplotlib/第一回:Matplotlib初相识.pdf”
self.qa = load_db(self.loaded_file,”stuff”, 4)
# 将文档加载到聊天机器人中
def call_load_db(self, count):
“””
count: 数量
“””
if count == 0 or file_input.value is None: # 初始化或未指定文件 :
return pn.pane.Markdown(f”Loaded File: {self.loaded_file}”)
else:
file_input.save(“temp.pdf”) # 本地副本
self.loaded_file = file_input.filename
button_load.button_style=”outline”
self.qa = load_db(“temp.pdf”, “stuff”, 4)
button_load.button_style=”solid”
self.clr_history()
return pn.pane.Markdown(f”Loaded File: {self.loaded_file}”)
# 处理对话链
def convchain(self, query):
“””
query: 用户的查询
“””
if not query:
return pn.WidgetBox(pn.Row(‘User:’, pn.pane.Markdown(“”, width=600)),
scroll=True)
result = self.qa({“question”: query, “chat_history”: self.chat_history})
self.chat_history.extend([(query, result[“answer”])])
self.db_query = result[“generated_question”]
self.db_response = result[“source_documents”]
self.answer = result[‘answer’]
self.panels.extend([
pn.Row(‘User:’, pn.pane.Markdown(query, width=600)),
pn.Row(‘ChatBot:’, pn.pane.Markdown(self.answer, width=600, style=
{‘background-color’: ‘#F6F6F6’}))
])
inp.value = ” # 清除时清除装载指示器
return pn.WidgetBox(*self.panels,scroll=True)
# 获取最后发送到数据库的问题
@param.depends(‘db_query ‘, )
def get_lquest(self):
if not self.db_query :
return pn.Column(
pn.Row(pn.pane.Markdown(f”Last question to DB:”, styles=
{‘background-color’: ‘#F6F6F6’})),
pn.Row(pn.pane.Str(“no DB accesses so far”))
)
return pn.Column(
pn.Row(pn.pane.Markdown(f”DB query:”, styles={‘background-color’:
‘#F6F6F6’})),
pn.pane.Str(self.db_query )
)
# 获取数据库返回的源文件
@param.depends(‘db_response’, )
def get_sources(self):
if not self.db_response:
return
rlist=[pn.Row(pn.pane.Markdown(f”Result of DB lookup:”, styles=
{‘background-color’: ‘#F6F6F6’}))]
for doc in self.db_response:
rlist.append(pn.Row(pn.pane.Str(doc)))
return pn.WidgetBox(*rlist, width=600, scroll=True)
# 获取当前聊天记录
@param.depends(‘convchain’, ‘clr_history’)
def get_chats(self):
if not self.chat_history:
return pn.WidgetBox(pn.Row(pn.pane.Str(“No History Yet”)), width=600,
scroll=True)
rlist=[pn.Row(pn.pane.Markdown(f”Current Chat History variable”, styles=
{‘background-color’: ‘#F6F6F6’}))]
for exchange in self.chat_history:
rlist.append(pn.Row(pn.pane.Str(exchange)))
return pn.WidgetBox(*rlist, width=600, scroll=True)
# 清除聊天记录
def clr_history(self,count=0):
self.chat_history = []
return
接着可以运行这个聊天机器人:
# 初始化聊天机器人
cb = cbfs()
# 定义界面的小部件
file_input = pn.widgets.FileInput(accept=’.pdf’) # PDF 文件的文件输入小部件
button_load = pn.widgets.Button(name=”Load DB”, button_type=’primary’) # 加载数据库
的按钮
button_clearhistory = pn.widgets.Button(name=”Clear History”,
button_type=’warning’) # 清除聊天记录的按钮
button_clearhistory.on_click(cb.clr_history) # 将清除历史记录功能绑定到按钮上
inp = pn.widgets.TextInput( placeholder=’Enter text here…’) # 用于用户查询的文本输入
小部件
# 将加载数据库和对话的函数绑定到相应的部件上
bound_button_load = pn.bind(cb.call_load_db, button_load.param.clicks)
conversation = pn.bind(cb.convchain, inp)
jpg_pane = pn.pane.Image( ‘./img/convchain.jpg’)
# 使用 Panel 定义界面布局
tab1 = pn.Column(
pn.Row(inp),
pn.layout.Divider(),
pn.panel(conversation, loading_indicator=True, height=300),
pn.layout.Divider(),
)
tab2= pn.Column(
pn.panel(cb.get_lquest),
pn.layout.Divider(),
pn.panel(cb.get_sources ),
)
tab3= pn.Column(
pn.panel(cb.get_chats),
pn.layout.Divider(),
)
tab4=pn.Column(
pn.Row( file_input, button_load, bound_button_load),
pn.Row( button_clearhistory, pn.pane.Markdown(“Clears chat history. Can use
to start a new topic” )),
pn.layout.Divider(),
pn.Row(jpg_pane.clone(width=400))
)
# 将所有选项卡合并为一个仪表盘
dashboard = pn.Column(
pn.Row(pn.pane.Markdown(‘# ChatWithYourData_Bot’)),
pn.Tabs((‘Conversation’, tab1), (‘Database’, tab2), (‘Chat History’, tab3),
(‘Configure’, tab4))
)
dashboard
以下截图展示了该机器人的运行情况:
您可以自由使用并修改上述代码,以添加自定义功能。例如,可以修改 load_db 函数和 convchain方法中的配置,尝试不同的存储器模块和检索器模型。
此外,panel 和 Param 这两个库提供了丰富的组件和小工具,可以用来扩展和增强图形用户界面。Panel 可以创建交互式的控制面板,Param 可以声明输入参数并生成控件。组合使用可以构建强大的可配置GUI。
您可以通过创造性地应用这些工具,开发出功能更丰富的对话系统和界面。自定义控件可以实现参数配置、可视化等高级功能。欢迎修改和扩展示例代码,开发出功能更强大、体验更佳的智能对话应用。
嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“面向开发者的LLM入门教程-聊天Chat:定义聊天机器人”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!
还没有评论呢,快来抢沙发~