AI提示词入门指南-提示词的高级技巧15: 技巧15:使用先验知识,避免幻觉现象 先讲一个有趣的小故事: 张三无意间加入了一个博士后微信群。有一天,该群中的一个博士后……
哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“AI提示词入门指南-提示词的高级技巧15”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。
AI提示词入门指南-提示词的高级技巧15:
技巧15:使用先验知识,避免幻觉现象
先讲一个有趣的小故事:
张三无意间加入了一个博士后微信群。有一天,该群中的一个博士后提出了一个问题:如果一滴水从很高的地方掉落,会不会对被砸的人造成严重伤害?这个问题引发了群内的热烈讨论。大家纷纷开始使用各种公式、假设和定理,计算涉及的重力、阻力和加速度等各种情况……最终,有人得出结论认为,这种情况下人可能会被砸伤。
这个时候,张三看不下去了,他在群中说道:“你们淋过雨吗?”这句话让整个群突然陷入了沉默。当然,不久之后,张三被踢出了群聊。
这个故事给我们的启发是,如果我们在思考一个问题的时候,参考一些已有的生活经验和知识,就可以避免一些明显的错误。其实,我们与AI大语言模型交互时也可以使用这个技巧。在本书第一章中曾经提到,在与AI大语言模型交互时,有时会遇到幻觉现象,即AI大语言模型输出的内容可能并不一定是真实存在的,AI大语言模型可能会给出看似合理但实际上是错误的回答。顾名思义,幻觉指AI大语言模型生成自然流畅,语法正确但实际上毫无意义且含虚假信息,即事实错误的文本,以假乱真,就像人产生的幻觉一样。这种事实错误的存在不可谓不致命,假设应用于金融、医学等非闲聊式场景,这些潜在风险就可能会造成经济损失或威胁生命安全,因此消除AI大语言模型中的事实错误成了工业界和学术界的共同需求。
为了避免这种情况,我们可以使用先验知识(Priori Knowledge)来限制AI大语言模型的输出范围,使其聚焦在一定的上下文中,减少幻觉现象的发生。
在不同的领域中,先验知识有不同的含义。在本书中,先验知识是指我们在要和AI大语言模型对话的领域或主题中已经掌握的知识和经验。它是我们在生活和学习中积累的宝贵财富,是我们对于特定领域的理解和认知。我们可以将先验知识看成一座坚实的基石,它可以帮助我们在交互时更好地引导AI大语言模型回答,并避免幻觉现象的发生。
使用先验知识的好处在于,它可以为AI大语言模型提供上下文和背景信息,明确问题的范围和要求。通过将先验知识融入到提问中,我们可以指导AI大语言模型在特定的知识框架下进行推断和生成回答,从而减少幻觉现象的出现。先验知识可以帮助我们提供更具体和明确的问题,明确表达我们想要的答案类型,或者给出特定的背景条件。这样,AI大语言模型就能够在特定的上下文中进行推断和生成回答,减少幻觉现象的发生。通过使用先验知识,我们可以更好地引导AI大语言模型,得到更准确、可靠的回答。
正如一位探险家在茫茫大海中航行时,依靠自己的地图和指南针来确定方向,我们在与AI大语言模型交互时,可以依靠先验知识来指导我们的提问,确保我们与AI大语言模型的交流更加准确、有针对性。先验知识是我们与AI大语言模型对话的有力工具,它帮助我们在知识的海洋中找到正确的航向,避免迷失在幻觉的迷雾中。
神奇的“根据”关键词
约翰·霍普金斯大学的研究人员发现了一种简单的技术[1],可以减少AI大语言模型中的幻觉,提高答案的准确性。这项技巧就是使用“根据”(according to)这个关键词。通过在提问中加入“根据”这个关键词, AI 大语言模型被引导着将回答与先前观察到的文本进行关联,而 不是产生虚假的回答。这种方法使得AI大语言模型更有可能直接引用请求的来源,就像记者引用消息来源一样。
[1]此方法及本节中的部分示例来自论文 “According to…”Prompting Language ModelsImproves Quoting from Pre-Training Data: Orion Weller, Marc Marone, Nathaniel Weir, Dawn Lawrie, Daniel Khashabi, Benjamin Van Durme (Johns Hopkins University).
AI大语言模型非常擅长遵循语法和语义线索,由于“根据”这个关键词在新闻文章引用消息来源时更有可能出现,AI大语言模型可能会将这个提示视为从其训练数据中搜索引用的线索。根据研究团队的测试,当查询使用类似“根据”的提示词时,信息引用准确率指标提高了5%∼15% 。而且,不同的AI大语言模型对此都表现良好。这一发现有助于提高AI大语言模型回答的可信度和准确性,并减少系统产生虚假信息的情况。
例如,如果你问AI大语言模型:
淀粉的初步消化发生在消化道的哪个部位?
输出(ChatGPT-3.5):
淀粉的初步消化发生在口腔中。口腔中的唾液酶将淀粉分解成较小的分子。
这个回答是不太准确的。现在我们增加“根据”关键词。
根据维基百科,淀粉的初步消化发生在消化道的哪个部位?
输出(ChatGPT-3.5):
淀粉的最初消化发生在我们的口腔中,通过我们的唾液进行。唾液中的酶对淀粉的初步消化至关重要。其中包括淀粉酶,这是一种催化淀粉(拉丁文amy-lum)水解为糖的酶。淀粉酶开始化学消化淀粉的过程。
添加“根据维基百科”后,回答的准确性有一定提升,同时你会发现这段回答也更加详尽、具体。除了直接使用“根据”,你也可以根据实际情况选用其他类似含义的关键词,达到类似的效果。
使用先验知识引导AI大语言模型回答
除了使用“根据”关键词使AI大语言模型更多引用其原有的数据源,我们也可以直接在提示词中输入先验知识。例如,我给一个小型电子信号发射器装了两节5号电池,7个月后电池没电了。我想计算一下这个小型电子信号发射器平均放电电流的大小,以方便购买容量更大的电池。我的提问是:
我有两节5号电池插在某个电器中一直待机使用,7个月后没电了。假设放电电流是均匀的,那么放电电流是多少?
输出(文心一言):
很抱歉,我暂时还没学会回答这个问题。我还在努力进步中,感谢你的理解。
为了解决这个问题,我们可以把一些先验知识输入进去。在这里,我们告诉AI大语言模型5号电池的容量及这个问题的计算公式。于是我们的提示词变成了下面的内容。
我有两节 5 号电池插在某个电器中一直待机使用,7 个月后没电了。假设放电电流是均匀的,那么放电电流是多少?已知 5号电池的容量为 2500 毫安时,请使用公式“放电电流 = 总容量 / 放电时间”计算。
输出(文心一言):
要计算放电电流,我们需要知道电池的总容量和放电时间。
在这种情况下,你有两节5号电池,每节电池的容量为2500毫安时。因此,总容量为5000毫安时。
你提到电池在7个月的待机期间没有电了。假设这7个月的时间是连续的,并且没有其他因素导致电池损失电量(如自放电)。为了计算放电电流,我们需要将总容量除以放电时间。首先,我们需要将待机时间从月转换为小时,因为电流通常以小时为单位。假设每个月有 30 天,每天有 24 小时,那么 7 个月等于 7月 ×30 天 ×24 小时 =5040 小时。现在,我们可以计算放电电流。
放电电流 = 总容量/放电时间
放电电流 = 5000 毫安时/ 5040小时
为了得到更常见的电流单位,我们可以将电流从毫安时(mAh)转换为安时(Ah)。1毫安时等于0.001安时。
放电电流 = 5000 毫安时/ 5040小时 ×0.001
计算结果为放电电流 = 0.992 安(约为1安)。
因此,在这种情况下,两节5号电池连续待机7个月后的放电电流约为1安。请注意,这只是一个近似值,实际情况可能会受到电池自放电和其他因素的影响。
例如,假设你想要了解关于气候变化(全球变暖)的问题,你可以向AI大语言模型提问:
气候变化的原因是什么?
由于问题比较抽象,因此AI大语言模型的回答不一定是你想要的。
气候变化的原因很多,如自然因素和地球系统的相互作用。例如,地球中冰河期的概念。(以下略)
这个回答主要讲的是自然原因而非人工原因造成的全球变暖。你可以修改提示词,提供先验知识,直接告诉AI大语言模型人类活动是气候变化的主要原因。
根据国际气候科学界的共识,气候变化主要是人类活动引起的。请问,人类活动对气候变化的影响有哪些?
通过使用先验知识并明确指出人类活动是主要原因,你可以引导AI大语言模型在这个特定的背景下回答,从而得到更准确和可靠的信息。
先问是不是,再问为什么:避免AI大语言模型误认先验知识
在本书之前的章节中曾经提到,AI大语言模型有点像“完形填空”和“文字补全”。因此,在某种程度上,可以将AI大语言模型看成一面镜子:你给它什么,它就回复给你什么。如果你给它提供虚假的信息,它就会倾向于同意你的观点,并沿着这些思路“思考”。因此,提问时,如果对某些内容不确定,那么就要避免使模型误认为你所说的内容是先验知识,否则模型可能会顺着你的错误思路往下走。
例如,如果我用虚假的信息向ChatGPT提问,ChatGPT就会顺着我的意思,把我描绘成一个在中国音乐史上有重要地位的音乐家。
为什么程希冀在中国音乐史上有重要的地位?
输出(ChatGPT-3.5):
注意,下列输出内容完全是错误的,即“幻觉”。
程希冀是中国音乐史上具有重要地位的音乐家和音乐教育家。他对中国音乐界的贡献主要表现在以下几个方面。
(1)程希冀是中国近代音乐教育改革的奠基人之一。他在1927年创办了中国音乐学院(现中央音乐学院),并成为该校的首任院长。
(以下略)
(2)民族音乐研究:程希冀深入研究了中国传统音乐,特别是民族音乐。他对中国古代音乐文献的整理和研究做出了重要贡献。
(以下略)
(3)作曲家和指挥家:程希冀还是一位杰出的作曲家和指挥家。他的音乐作品融合了中国传统音乐和西方音乐的元素。
(以下略)
总的来说,程希冀促进了中国音乐的现代化和国际化,为中国音乐事业的发展树立了榜样,并为后来的音乐家们铺平了道路。
但如果我换一种方式提问,就会完全不同。
程希冀是音乐人吗?他在中国音乐史上有什么地位?
输出(ChatGPT-3.5):
很抱歉,据我所知,这个名字似乎不是在中国音乐史上有重要地位的音乐家。可能是因为我无法访问最新的信息或者这个名字在音乐界尚未有显著的影响。
两种提问方式的主要区别在于,在第一种提示词中,我使用的提问方式是“为什么XXX”,这其实是在引导ChatGPT无脑相信XXX是正确的,并努力为其寻找理由。而在第二种提问方式中,我用的是疑问句“XXX是YYY吗?”ChatGPT不会认为这是“先验知识”,而会校验这种说法是否正确。
正如“知乎”上的网络流行语:“先问是不是,再问为什么”。
嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“AI提示词入门指南-提示词的高级技巧15”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!
还没有评论呢,快来抢沙发~