期刊:《大模型提示词的生成、共享和复用》
杨栋,孙秋瑞
(北京师范大学 信息网络中心,北京 100875)
[摘 要] 大模型提示词从早期的口语对话,发展到当今的智能体角色和技能描述。提示词的使用效果依赖于用户自行摸索,目前仍缺乏自动生成、共享与复用机制。构建基于提示词要素规范化的生成机制,以及基于提示词数据库的共享和复用机制,并提出未来发展方向,旨在促进大模型在教育及其他领域的高效应用。
[关键词] 大模型;提示词;生成;共享;复用
0 引言
近年来,大模型技术迅猛发展,尤其在教育领域,师生自主创建大模型的需求不断涌现。提示词作为大模型的输入信息,从早期的自然语言对话形式,发展到当今能够对智能体的角色和技能进行精确定义[1]。然而,编写优秀的提示词对普通用户而言是一件困难的任务,如何有效编写提示词来定制大模型成为关键问题。因此,构建完善的提示词生成、共享和复用机制,对推动大模型更好地服务于人类社会,特别是教育教学场景,具有重要的现实意义。
1 提示词的发展脉络
1.1 早期提示词的自然语言形式
在大模型发展初期,提示词的设计致力于适配人类自然语言的丰富性与灵活性。由于人们日常交流习惯多样,表达需求、提出问题或下达指令的方式各不相同,提示词被构建得尽可能贴近自然语言。例如,用户既可以简单询问“手机摄像头拍照模糊怎么办”,也能要求“你是一位物理学家,请用通俗易懂的方式详细阐述薛定谔的猫”。这种偏向自然语言的提示词主要依赖人力编写,虽然增强了模型对不同用户的包容性,但也存在模糊性和不规范性的问题,难以将其提升为经验并指导其他大模型提示词的编写。
1.2 系统提示词和用户提示词的分化
随着大模型应用场景的不断拓展,用户逐渐意识到需要为特定任务定制专用大模型。例如,教育领域的智能助教建设中需要定制大量专用智能体:学业规划、知识问答、概念讲解、资源推荐、解题启发、写作指导、作业反馈、同伴助手、习题推荐等[2]。提示词模板技术[3]和提示词调优技术[4]的发展,使人们可用精心编写的提示词来定制专用大模型。从通用大模型中定制专用大模型不再需要大量的训练,只需要不断优化提示词的表达方式即可完成。
上述发展变化促使提示词分化为系统提示词和用户提示词。系统提示词用于定制大模型的行为和功能,设定对话边界,如告知模型如何提问、如何提供信息以及哪些问题不被接受。用户提示词则是每次交互时的具体命令,明确模型要执行的任务或意图[5]。例如,在“你是一位物理学家,请用通俗易懂的方式详细阐述薛定谔的猫”这句提示词中,“你是一位物理学家”是系统提示词,“请用通俗易懂的方式详细阐述薛定谔的猫”是用户提示词。对于通用大模型,系统提示词不是必需的,但对于专用大模型,系统提示词是确保回答不偏离既定方向的关键。这种分化使提示词能够更好地适应不同的任务需求。
1.3 如何克服编写提示词的困难
随着大模型的广泛普及,当今社会已进入大众自主设计大模型的崭新时代。普通用户期待通过简单编写提示词,就能定制契合自身需求的智能体。教育领域也出现了旺盛的需求,教师期望打造个性化的教学助手,学生想要创建独特的对话伙伴。然而,普通用户在实际操作过程中发现,随手编写的系统提示词往往难以达到理想效果。例如,一位教师尝试为语文阅读课定制智能体,他输入“帮我生成一个小学语文阅读助教”作为提示词,得到的回答可能过于笼统、缺乏针对性。这是因为用户心目中的“小学语文阅读助教”有很多细节要求,例如,“阅读之前是否需要讲解背景”“何时需要精读”等。
模糊、简略的系统提示词无法有效生成符合用户要求的智能体。为获取满意结果,用户不得不投入大量时间和精力,对提示词进行反复调试。从调整语言表述、细化任务要求,到增加限定条件、补充背景信息,每一次尝试都是对提示词优化的探索。这一现实困境迫切需要有效的解决方案,其中至关重要的是构建两个机制。其一,优化自动生成提示词的机制。这一机制允许基于细分领域和更多细节知识生成更精准的提示词。其二,构建提示词存储、共享和复用机制。当用户历经艰辛调试出优质提示词后,若能将它们存储于提示词数据库中,供其他有类似需求的用户复用,既能避免重复劳动,又能汇聚众人智慧,从而推动大模型在各领域中的高效应用。
2 自动生成提示词
普通用户随手编写的提示词效果不佳,往往是因为笼统的提示词没有覆盖用户心中的细节要求。优化自动生成提示词的机制,首要任务便是对提示词进行规范化处理,这是构建清晰准确的提示词的基础。通过规范统一的要素、结构和格式,提示词能够具备更强的逻辑性与精确性。在此基础上,进一步设计“生成提示词的提示词”,让大模型更精确地自动生成提示词。
2.1 提示词要素的规范化
经过深入分析,本文总结出提示词的几个关键要素和含义,并列举了它们在精确表述提示词中的用法,如表1所示。
表1 提示词要素
Table 1 Prompt elements
width=733,height=316,dpi=110
基于上述用法,本文分别针对各个要素生成提示词,在生成过程中尽可能参考细分领域并嵌入细节知识。实验表明,基于上述步骤生成的提示词,经过简单转换就可以在不同平台上得到良好的应用[5-7]。笔者在扣子平台上实现了提示词转换的应用[8],该应用示例了将提示词转换到其他平台的方法。
由此表明,尽管不同大模型平台的产品形态各异,但在核心的语义理解与指令执行层面,业界已经形成了相对统一的提示词要素标准。这种兼容性打破了平台间的壁垒,使提示词要素可以在不同生态中被复用,也为下一步自动生成提示词奠定了基础。
2.2 自动生成提示词
在提示词要素规范化的基础上,本文研究了一类特殊的能够自动生成提示词的大模型,并将生成提示词的提示词称为元提示词。元提示词用来引导大模型生成普通提示词,处于更高层级。
元提示词的设计遵循上一节中生成提示词的步骤,在实践中,我们主要基于现有的成功案例设计元提示词。如图1所示,通过深入研究大量提示词案例,总结各个提示词要素的共性与特点,进而提炼出元提示词,将其配置在提示词生成大模型中,即可生成可以复用的普通提示词。
width=519,height=37,dpi=110
图1 提示词生成示意图
Fig.1 Schematic diagram of the prompt generation
笔者在扣子平台上开发了一个生成提示词的示例应用[9],该应用通过分析已有提示词案例,结合用户输入的任务需求,利用配置元提示词的提示词生成大模型,进而生成符合要求的提示词。该应用目前支持5种提示词模板:通用提示词、角色提示词、任务提示词、意图识别提示词、通用变量提示词,并为这5种提示词的生成分别构建了5个工作流。
在教育场景中,基于该示例应用,教师可以选择需要生成的提示词类型,例如“通用提示词”,再输入对提示词的要求,例如“帮我生成一个物理学课程助教”。该应用将根据这些信息生成相应的提示词,助教大模型可用于回答学生对物理学课程的提问。表2展示了“物理学课程助教”的普通提示词与生成它的元提示词的对比情况。
表2 “物理学课程助教”的普通提示词和元提示词对比情况
Table 2 Ordinary prompts and meta-prompts of “physics course assistant”
width=733,height=369,dpi=110
3 共享和复用提示词
3.1 存储和共享提示词
构建完善的提示词存储机制对发挥大模型智能体效能至关重要。从载体形式上看,提示词本质上是一大段文本,由提示词要素组成。从知识形式上看,提示词是各领域专业知识的凝结,用于指导大模型工作。因此,有必要将提示词存储下来,并在各领域的大模型设计中进行共享和复用。同时,提示词的文本属性,意味着它们可以被方便地存储在目前主流的数据库中。
如图2所示,对从不同业务系统共享而来的提示词进行清洗,去除重复和不规范内容,依据统一分类标准(如技术领域、应用领域、任务类型、数据特点等)归类并入库。采用人工审核与人工智能相结合的方式优化入库提示词的质量,人工审核确保提示词符合业务常识和表达规范,人工智能模型进行批量格式转换或应用场景转换,最后存储优化后的提示词。
width=520,height=37,dpi=110
图2 提示词共享示意图
Fig.2 Schematic diagram of the prompt sharing
建立提示词的开放共享平台是实现提示词价值最大化的关键。在教育领域,教师可以在平台上分享具有良好教学效果的提示词,同时也可以获取其他教师提供的优质提示词。例如,一位教师在使用大模型开展语文阅读教学时,创建了一个引导学生分析文章结构的提示词,并通过共享平台分享给其他教师。其他教师在通过必要的审核之后可以获取该优质提示词,并可应用在自己的语文写作教学智能体中。规范且质量上乘的共享提示词,有助于促进教育领域开展基于大模型的教学创新应用。
3.2 复用提示词
提示词复用是提高效率、减少重复劳动的关键环节。在教育场景中,当师生设计自己的科研助手时,可以从提示词数据库中请求可复用的系统提示词,如“科研论文主题推荐助手”“科研论文资料分析助手”“科研文献检索助手”等。
根据以上场景需求,笔者设计了提示词复用框架,如图3所示。首先,设计提示词数据库,用来存储多个完整的系统提示词文本。提示词文本包括完整的提示词要素,如角色、技能、限制等。提示词数据库还存储辅助检索的提示词属性,如提示词的名称、领域、分类、标签等。其次,在大模型的设计界面,嵌入系统提示词复用搜索框或选择框,用来搜索或选择系统提示词。最后,将搜索到的系统提示词自动嵌入大模型智能体。
width=519,height=48,dpi=110
图3 提示词复用示意图
Fig.3 Schematic diagram of the prompt reuse
例如,笔者在扣子平台上创建了一个提示词复用的应用[10],该应用构建了一个科研助手的提示词数据库,搭建了一个提示词复用的工作流,以及一个示例性的提示词复用页面。如图4所示,该工作流的开始节点接收两个参数,prompt_input接收系统提示词文本,user_input接收用户对该提示词的测试要求(即用户提示词)。在大模型节点的配置中,将系统提示词直接设置为{{prompt_input}},用户提示词直接设置为{{user_input}}。
width=649,height=133,dpi=110
图4 提示词复用的工作流
Fig.4 Workflow of the prompt reuse
在提示词复用页面中,系统根据用户的选择从提示词数据库中获取相应的提示词文本。提示词数据库中的提示词经过前期存储和整理,在提示词属性中设置了提示词标签,用来辅助用户搜索或选择。系统通过调用上述工作流,将用户选择的提示词嵌入大模型智能体。用户在提示词页面中可输入测试要求,根据大模型的输出来观察提示词的效果。该提示词页面是示例性的,在实际系统中仅需要以下必要步骤:从提示词数据库中获取提示词,并将提示词嵌入大模型智能体。
4 实验测试
为确保提示词生成、共享和复用的有效性与可靠性,本文设计了大模型提示词测试框架。该测试框架遵循国际标准规范,参考ITU-T F.748.44《基础模型的评估标准:基准测试》[11],构建科学的测试体系。该测试框架涵盖功能测试、性能测试、安全性测试及生成式大模型专项测试(幻觉测试)四大核心维度。功能测试围绕要素完整性与任务完成性展开;性能测试聚焦模型响应时间与资源消耗情况,评估提示词的执行效率与资源适配性;安全性测试通过异常输入处理与对抗攻击测试,确保模型在复杂场景下稳定运行;生成式大模型专项测试着重验证模型输出内容的准确性,避免出现事实性错误的幻觉现象。
在本次针对大模型提示词生成、共享、复用的研究中,性能、安全性及幻觉测试并非重点,我们聚焦于功能测试维度,围绕要素完整性与任务完成性展开。第一,要素完整性旨在确保提示词涵盖目标(角色)、方法(技能)、限制和输出形式等关键要素。第二,任务完成性检验提示词能否精准引导模型完成特定任务,如生成符合规范的科技论文摘要,并从易读性、逻辑性等方面评估内容质量。
本次功能测试聚焦高校教育教学领域,构建5大核心场景,并进一步细分出16个子场景,每个子场景配备10条用户输入任务,形成包含160条任务的测试集,测试集可从“大模型+”开源网站下载[12]。通过人工评判,对提示词的要素完整性与任务完成效果进行严格审核。
测试结果(见表3)表明,本文设计的提示词在要素完整性方面表现优异,16个子场景的提示词均完整涵盖必要要素。在任务完成性上,任务完成率达到94.375%,绝大多数提示词能够有效引导模型完成用户输入的任务,充分验证了提示词生成、共享与复用方案在功能层面的可行性与有效性。
表3 测试结果
Table 3 Test result
width=352,height=111,dpi=110
5 结束语
本文梳理了提示词的发展脉络,提出了提示词要素规范化的方法,详细阐述了提示词生成、共享和复用的实践与应用。模糊、简略的提示词无法满足用户的个性化要求,通过构建完善的提示词生成、共享和复用机制,有望为普通用户自主构建大模型提供帮助。虽然提示词生成、共享和复用在理论研究和实践探索上取得了一定进展,但在实际应用中仍面临诸多挑战。本文基于主流大模型平台验证了提示词跨平台复用的可行性,但不同模型架构的设计理念各异,版本迭代频繁,同一提示词在不同模型上可能产生不同效果。因此,后续研究需关注提示词的评测机制,为提示词的有效生成和复用提供理论和实践指导。
[参考文献]
[1] 程希冀.学会提问,驾驭AI:提示词从入门到精通[M].北京:电子工业出版社,2024:129-148.
[2] 当高校“定制版”DeepSeek开启“深度求索”[N].中国新闻,2025-02-26(8-9).
[3] SCHICK T, SCHÜTZE H. Exploiting cloze questions for few shot text classification and natural language inference[C]//16th Conference of the European Chapter of the Association for Computational Linguistics. Stroudsburg,USA:Association for Computational Linguistics,2021:255-269.
[4] LI X L, LIANG P.Prefix-tuning: optimizing continuous prompts for generation[C]//In Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing. Stroudsburg,USA:Association for Computational Linguistics,2021:4582-4597.
[5] 提示词概述[EB/OL].(2025-03-28)[2025-04-01].
[6] 腾讯元器官方文档:2.1.3 快速创建公众号智能体(如何写提示词、知识库)[EB/OL].(2025-04-22)[2025-06-05].
[7] 腾讯元器官方文档:2.2 如何写“详细设定”[EB/OL].(2025-04-22)[2025-06-05].
[8] 教育大模型之提示词研究:提示词转换[EB/OL].(2025-03-28)[2025-04-01].
[9] 教育大模型之提示词研究:提示词生成[EB/OL].(2025-03-28)[2025-04-01].
[10] 教育大模型之提示词研究:提示词复用[EB/OL].(2025-03-28)[2025-04-01].
[11] F.748.44:Assessment criteria for foundation models -benchmark[EB/OL].(2025-03-16)[2025-03-28].
[12] Large-model-plus[EB/OL].(2025-03-28)[2025-04-01].
Generating, Sharing and Reusing of Prompt for Large Language Models
YANG Dong, SUN Qiurui
(Center of Information &Network Technology, Beijing Normal University, Beijing 100875, China)
Abstract:The prompts for large language models have evolved from the early stage of spoken language conversations to the current descriptions of intelligent agent roles and skills. The effectiveness of the prompts depends on users’ self-exploration, and currently, there is a lack of mechanisms for the automatic generation, sharing, and reusing of prompts. This paper focuses on the mechanisms of prompt generation based on the standardization of prompt elements, and prompt sharing and reusing based on the prompt database. Additionally, future development directions are proposed to facilitate the efficient application of large language models in education and other fields.
Keywords:large language model;prompt;generation;sharing;reusing
[中图分类号] TP 18;TP 391.43
[文献标志码] A
[文章编号] 1005-0310(2025)04-0001-06
DOI:10.16255/j.cnki.ldxbz.2025.04.001
[收稿日期] 2025-04-01
[作者简介]
杨栋(1982—),男,山东莱州人,北京师范大学信息网络中心高级工程师,博士,主要研究方向为人工智能。
[通讯作者] 孙秋瑞(1983—),男,山东菏泽人,北京师范大学信息网络中心高级工程师,主要研究方向为人工智能。E-mail:qrsun@bnu.edu.cn
(责任编辑 白丽媛;责任校对 柴 智)
专题:《提示词模板在人工智能对话中的实践研究》
陈嗣荣,冯敬益
(广州市信息技术职业学校,广东 广州 510610)
摘要:通过与人工智能语言模型ChatGPT进行对话,总结出提示词在对话过程中的使用技巧,包括告诉人工智能扮演的角色、提示词模板、在提问过程中追问细节、提问时增加关键词等。利用以上提问技巧,使得ChatGPT的回答更有质量。
关键词:人工智能;提示词模板;对话
1 研究背景和意义
ChatGPT 是一个由OpenAI 公司开发的人工智能语言模型[1]。它的作用是回答各种各样的问题,帮助人们解决问题和获取信息。随着ChatGPT 的出现,人工智能(Artificial Intelligence,简称AI) 走入了人们的视野。提示在人工智能领域中的含义是指示AI 进行某些行为的过程。提示词模板设计并不单单用在跟ChatGPT的聊天中,也用于设计出更好用的,并且能够重复利用的人工智能提示词,用于跟各种各样的机器学习模型进行交互。本研究意义是根据不同的使用场景,设计出相应的提示词。如果没有使用正确的提示词,ChatGPT 的回答通常跟人们的需求相差甚远。如果能够编写出结构合理、AI 易懂的提示词,就可以让ChatGPT 的回答更为准确,可以增加用户的体验,使用户可以更加快速地得到结果,也可以降低初学者的学习成本,使他们不需要太多的学习就可以跟AI进行对话。
2 相关工作综述
2.1 提示词基础知识
在布置一个任务的时候,需要使用到一些词语来对执行任务的人进行引导或指示他怎么做,这些词语就叫提示词,它可以让执行者对任务要求和内容把握更为到位。一个良好的提示词可能包含以下四个元素:指令、背景、输入数据和输出指令。指令,这是人们希望AI完成的一个具体任务是什么。例如,根据如下表格信息,制作一张折线统计图。背景,这指外部的信息或者是额外的上下文,利用这些信息可以引导设计的模型做出更好的回应。例如,最近一年的收入财务报表。输入数据,是指人们想要问的具体问题,通过问题得到想要的回答。例如,最近半年的营收趋势是怎样的。输出指令,指定输出的AI回答的类型或是结构。例如,要求AI的回答是详细的,并且能够举出相关的例子。
如何让一个简单的接话茬能力让ChatGPT 看起来能够解决各种各样的任务呢?因为人类大部分的任务都是以语言为载体的。当人们前面说了一些话,它把接下来的话说对了,任务就完成了。ChatGPT 作为一个大语言模型,目的就是“把话说对”,而把话说对这件事情可以在不知不觉中帮助人们完成各种任务。
2.2 NLP基础知识
自然语言处理(NLP)属于计算机科学的其中一个领域[2-4],它可以使机器能够阅读和理解人类的各种语言[2,5],把语句里的细节进行分离并辨识,就像人类相互理解对方说的话一样,自然语言处理包含自然语言理解和自然语音处理两个部分。NLP 可以处理一些非结构化的文本,如“把地拖干净”“把鸡肉和白菜添加到我的购物清单中”这样的命令,同时可以转换非结构化文本和结构化文本。把非结构化的文本变成结构化文本,这个过程叫自然语言理解,例如在上面的那个例子中,购物清单可以看成一个列表,鸡肉和白菜可以看成是列表里面的子元素。把结构文本变成非结构化文本,这个过程叫自然语言生成。例如,把课程表的格式去掉,只保留语文、数学等科目名称。
在处理的过程中,NLP 把句子分解成单词,然后进行标记。有时候一些英语单词是有共同的词干的,也把它进行一些特定的标记,这样就能短时间掌握比较多的单词。还可以通过词形还原掌握更多的单词。词形还原是将一个给定的标记,通过字典的定义来学习它的含义,并推导出它的根或词元。如better 和good,better 是从good 衍生出来的,所以better 的词根就是good,都把它作为同一个标记。
2.3 提示词模板在人工智能对话的应用
从用户的角度看,ChatGPT 的形式就是一个对话机器人,准确地说是“续写”机器人。从技术上来讲,ChatGPT它从来都不是一个专门为问答和对话设计的系统。ChatGPT 是一个语言模型,语言模型就是刻画语言最基本的规律。那么如何去建立语言模型呢?可以只做一件事情:掌握词汇间的组合规律,而掌握这种规律最直接的表现就是让语言学会“续写”,类似于人类的“接话茬”。当给出前N个词汇的时候,如果一个模型能够告诉人们第“N+1”个词汇大概率会是什么,就认为该模型掌握了语言的基本规律。ChatGPT就是这样一个语言模型。虽然ChatGPT 看起来能完成各种任务,但它本质上只做这一件事情:续写,告诉你第“N+1”个词是什么。
2.4 提示词模板在其他领域的应用
除了如ChatGPT这样的大型语言模型外,AI绘画同样也是需要提示词进行创作。利用提示词,可以创作各种各样风格的卡通头像,也可以进行各种插画的绘制,也可以帮模特实现“一键换装”,节约公司的运营成本。
3 向AI提问的方法与技巧
3.1 告诉AI你是谁
在进行一段对话前,首先让AI 进行角色定位,通过告诉AI它现在要扮演的角色,可以回答我哪些方面的问题,这样会使得它的回答更为专业。例如,人们跟AI对话的第一句是:“你现在扮演一位教授本科学段的计算机老师,明白角色请回复明白。”这样AI就会以一位计算机老师的身份跟人们进行对话,如图1所示。
pagenumber_ebook=20,pagenumber_book=14
图1 身份确认
3.2 设置个性化的提示词模板
提示词模板包含了格式模板、文案模板、个人信息模板等。
当你希望AI 的回答结果是按你预想的格式进行回答的时候,可以采用格式模板。预先给AI一个相关格式的例子,例如输入以下内容:
问题:广东的省会是哪里?
答案:【广州】
问题:湖南的省会是哪里?
AI会回答以下内容:
“湖南的省会是【长沙】。”
在上面的这个例子里,“【】”号就是设定的格式。
3.3 对细节进行追问
在跟AI 进行对话的过程中,AI 对人们的提问会作出一个基础的回答,但是这些答案并不一定是想要的答案,这个时候就要跟AI进行充分的沟通,例如提示它:“在你回答这个问题之前,可以继续问我一些跟这个回答相关的问题”。如果对AI的回答不满意,可以跟它提出不满意的地方,例如回答不够详细,用的词过于深奥等,让它修正它的答案,通过这样一步一步地引导,AI就会生成人们想要获取的满意答案。如果在对话的过程中,AI 回答的答案跑偏了,人们也要及时对提的问题作出修正,例如我需要AI帮我提取一篇文章的大纲,AI 回答的时候会有点发散,这时就增加一个条件,让它按照我给出的原文去进行提取,这样它的提取结果就会比较精确。
3.4 提问时增加关键词
在对AI进行提问的过程中,如果要使提问更有针对性,需要在提问的过程中增加一些关键词。例如想要AI告诉怎么完成这个过程,需要提示它,把实施的步骤罗列出来。对于一些比较专业的问题,AI一般只会对它进行名词解析,作为外行人很难去理解这些专业的名词解析。例如,笔者询问AI:C 语言、Python 语言、易语言这三种语言之间的关系,AI 的回答作为计算机专业的人员会比较容易理解,因为在以前学习的过程中已经学习了相关的知识,如图2所示。但是对于非计算机专业的人员,就会感到生涩难解,这时给出我们的另外的提示:“请转换成5岁孩子都能明白的解释,带上足够有趣的案例让我理解。”这样AI就会尝试用用户要求的条件再次去回答这个问题,如图3所示。
pagenumber_ebook=20,pagenumber_book=14
图2 对三种语言的解释
pagenumber_ebook=20,pagenumber_book=14
图3 追加要求后再次解释
3.5 任务分解,用列表把需求拆分成子任务
任务可以设定AI 要实现的具体目标,让AI 清楚地理解任务对于设计有效提示词至关重要。任务描述应具体、简洁,避免歧义或模糊,清晰的任务描述有助于AI 更好地理解它应该做什么并提高生成内容的质量,是设计提示词时要考虑的关键因素。在生成了总任务之后,用列表的方式把总任务细化成一个一个的子任务。拆分成子任务后,对每一个子任务都清楚描述它的细节,必要的时候,要对任务增加一些限制的条件,这样AI 才会对人们布置的任务有更深刻的认识。
3.6 提问中体现特殊性
提问的特殊性是指提示词的详细程度和精确度,对于设计提示词至关重要,因为它可以提高生成内容的质量和相关性。一般来说,提示词越具体,AI 就越有可能生成有针对性和准确的回答。模糊或笼统的提示词可能会导致来自AI的题外话、不相关或不一致的回复。例如,如果提问的内容是写一首诗,AI 写的诗歌可能并不是人们想要的,但把提问改为“写一首七言绝句,内容是跟春天有关,诗的开头都要带‘春’字。”这样AI就能按人们所要求的生成诗歌。
3.7 提示词的迭代
迭代是重复执行一系列操作的过程,每次执行都会根据之前的执行结果进行调整,是快速设计过程的关键部分。提示词模板设计是一个迭代的过程,可能需要多次尝试才能创建有效的提示。迭代通过设计、测试和测评的循环来提炼和改进提示词,每次迭代都应该以先前试验的结果为前置条件,目的在于解决遇到的任何限制。例如,当人们修改了提示词以提供更具体的说明或增加额外的上下文后发现AI 的回答变得模糊或它产生了偏离主题的回复,采用迭代方法可以持续改进和优化生成的内容。在设计有效、高质和与结果一致的提示词时,迭代是重要的考虑因素。
4 ChatGPT面临的挑战
4.1 ChatGPT的技术挑战
第一,它是不稳定和不可解释的。但这个缺陷不是ChatGPT 所独有的,而是整个深度学习模型所具有的,“涌现效应”导致这一问题更加严重。特别在一些敏感的领域,这一问题更加凸显。例如在自动驾驶领域,机器的事故率已经低于人类司机,但为何大家还不愿意完全相信自动驾驶呢?因为自动驾驶虽然事故率低,但是它的事故是不可解释的。
第二,知识更新。让ChatGPT 临时接受新的知识比较困难,很多知识在不同的领域是不一样的。人们经常会遇到在特定的场景需要特定的知识的情况,而对于ChatGPT而言,它很难做到。
第三,事实性错误。事实性错误是指信息不符合客观事实,而ChatGPT 是无法直接了解客观事实的,他只能了解语言。
第四,输出的同质性。ChatGPT 所做出的回答往往是人类的主流观点。因为它是一个概率模型,它会以大概率的答案去回答它的任务。例如,它为什么回答中国的首都是北京,因为它学的语料当中大部分人都是这么说的。它的这种特点实际上有可能加剧信息茧房现象。
此外,还有复杂目标导向、模型效率和模型优化等问题,不再赘述。
4.2 ChatGPT的科学问题
第一,语言不再是人类的专属。ChatGPT 可以生成语言。那么这个意味着什么呢?基本上可以预见,在未来的几年当中,互联网上大部分的信息将不再是人类撰写的。事实上,现在Twitter中30%以上的活跃用户都是机器人,在微博中也有大量的水军机器人。
第二,ChatGPT是否能够创造新的知识,还是只将训练语料中的知识换一种更精练和高质量的方式进行表达?如果是后者的话,那么人类对于ChatGPT 的使用会造成知识的收敛,降低人类知识的创造效率。如果ChatGPT 本身是能够创造新知识的,那它则会大大加速人类获得新知识的效率。
此外,还讨论了语言模型涌现与控制机制、语言的知识表达边界问题、自我意识与自由意志问题、人机共生问题、如何突破语言空间问题,不再赘述。
4.3 ChatGPT的伦理问题
第一,用户隐私的问题。人们输入的问题,技术上是可以被ChatGPT的所有者所获取。
第二,反向影响的问题。ChatGPT 会通过它所输出的内容,反过来影响人类的文化,就是人性异化,人性向机器靠拢、机器向人性靠拢。
第三,不当使用。比如说学生用ChatGPT去作弊。
第四,人机共生与加速极化。大模型和人类有一个典型的共生循环,什么意思呢?模型是依赖于人类产生的数据来训练的,ChatGPT 用人类说的话做训练之后,他再给出人类答案,并影响人类的认知。人类认知被影响之后,又会说新的话。“你有权保持沉默,但你说的每一句话都会成为训练语料”,新的话又变成ChatGPT 新的训练语料。如此反复,就形成一个共生循环。并进一步导致人工智能模型越来越像人,而人越来越像人工智能模型,会向一个人机共生的一种文化去靠近。
第五,生产力垄断与社会和国际关系重建。这一点恰好与区块链形成对比。区块链是分布式,能够去中心化,打破垄断。而ChatGPT 这种大模型需要大规模的数据和算力,只有极少数的人或者机构能够提供这样的服务。其实ChatGPT 很大程度上是来自于涌现,没有太多的新的技术。很多大的互联网公司都想形成ChatGPT 等技术的垄断,从而获得权力,并影响社会、国际关系。回顾互联网发展历史,互联网发明者Tim Berners-Lee 做得最伟大的一件事就是放弃了互联网专利。
第六,人工智能的社会角色与伦理地位。随着ChatGPT 越来越具有类人的特征,用户不可避免地会将其人格化的冲动。那么他是否会具有类人的地位?这个可能是需要考虑的问题。
5 结论与展望
人工智能,已经从一个概念进入到实际的生产使用中。要利用好人工智能为人类服务,就要掌握如何与人工智能进行有效沟通和对话,提示词模板,就是人和人工智能沟通的桥梁。在未来,成为一名提示词模板工程师是人工智能专业毕业生的一个好方向,现在已经有企业用高薪招聘提示词模板工程师。相信在近几年,这个行业会迎来井喷发展。
参考文献:
[1]WHITE J,FU Q,HAYS S,et al.A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT[EB/OL].[2023-03-20].ArXiv,abs/2302.11382.
[2]CHOPRA A,PRASHAR A,SAIN C.Natural language processing[J]. International journal of technology enhancements and emerging engineering research,2013,1(4):131-134.
[3] HIRSCHBERG J,MANNING C D.Advances in natural language processing[J].Science,2015,349(6245):261-266.
[4] MIHALCEA R,LIU H,LIEBERMAN H.NLP (natural language processing) for NLP (natural language programming)[J].Computational Linguistics and Intelligent Text Processing,2006:19-25.
[5]OTTER D W,MEDINA J R,KALITA J K.A survey of the usages of deep learning for natural language processing[J].IEEE Transactions on Neural Networks and Learning Systems,2021,32(2):604-624.
中图分类号:TP311
文献标识码:A
文章编号:1009-3044(2023)34-0013-03
开放科学(资源服务)标识码(OSID):pagenumber_ebook=19,pagenumber_book=13
收稿日期:2023-05-17
作者简介:陈嗣荣(1985—),男,广东广州人,讲师,硕士,研究方向为人工智能与软件开发;冯敬益(1979—),男,广东佛山人,高级讲师,硕士,研究方向为人工智能与软件开发。
【通联编辑:闻翔军】
专题:基于ChatGPT API和提示词工程的专利知识图谱构建
张玲玲 黄务兰
(上海商学院商务信息学院 上海 200235)
摘 要: [研究目的] 在信息爆炸的时代背景下,专利数据的快速增长为知识管理和分析带来了新的挑战。该文旨在探讨利用ChatGPT从专利摘要中抽取信息,构建专利知识图谱,以提升知识管理和分析的效率和准确性。[研究方法] 从中国知网专利数据库选取了智能驾驶领域的专利摘要,利用ChatGPT进行信息抽取。为实现高效批量处理,采用了ChatGPT API接口与模型进行交互。为确保信息抽取的准确性,多次迭代和优化提示词,设计了系统消息、助手消息及用户消息三种角色,通过模拟对话场景,引导模型精确抽取实体与关系。[研究结果/结论] 研究结果表明,ChatGPT成功从1 126份专利摘要中提取了丰富的五元组信息,并以此为基础构建了专利知识图谱。与传统方法如Bert2Keras相比,ChatGPT在精确率、召回率及F1值等关键指标上均表现出明显优势,分别达到了88.2%、88.3%和88.3%,远超Bert2Keras的34.7%、9%和14.6%。最后,利用抽取的实体关系和Neo4j技术,成功地构建了知识图谱并完成了可视化展示,便于通过Cypher语句进行查询操作。该研究不仅证实了ChatGPT在专利知识图谱构建中的可行性,也为其在知识产权管理、技术研发及竞争情报分析等方面的智能化应用奠定了基础。
关键词:ChatGPT API;提示词工程;专利知识图谱;实体关系抽取;智能驾驶
在全球数字化迅速推进的背景下,知识产权保护的紧迫性和重要性日益凸显。为应对这一挑战,优化专利资助奖励政策及考核评价体系成为了关键策略,旨在激励高价值专利的创造与保护,并促进专利密集型产业的成长。这一举措深刻嵌入创新驱动发展战略中,强调了提升专利质量和加速成果转化对增强国家创新能力的核心作用。然而,随着专利数据的海量增长,如何有效地挖掘、组织和利用这些宝贵的知识资源,成为一个亟待解决的问题。传统的专利信息检索系统虽然提供了基本的查询服务,但在揭示专利知识内在关联和深度理解方面存在明显不足[1],难以满足用户对知识发现和技术趋势分析等高级需求。
鉴于此,本文将目光投向了新兴的人工智能技术,特别是以ChatGPT API和提示词工程为基础的专利知识图谱构建技术。专利知识图谱是一种图形化的知识组织形式,能够清晰地展现专利之间的复杂关系。通过实体识别、关系抽取等技术手段,专利文档中的技术概念、发明人、申请机构、引用关系等关键信息被转化为节点和边,从而构建出一个多维度、动态更新的知识网络[2]。而ChatGPT API作为OpenAI推出的自然语言处理接口,凭借其卓越的语言理解和生成能力,为自动解析专利文本、提取关键信息提供了强大的技术支持。同时,提示词工程作为一种优化模型输入策略的方法,通过精心设计的提示词,能够引导模型更加精准地执行特定任务。在专利知识图谱的构建过程中,提示词工程有望进一步提高信息抽取的准确性和针对性。
本研究以ChatGPT API为基础,以公开的专利数据为研究对象,结合提示词工程进行实体关系联合抽取,旨在探索构建更加精细化、智能化的专利知识图谱。期望通过本研究,为专利知识的深度挖掘与高效利用提供一条创新的技术路径,以助力企业创新决策、学术研究和政策制定。同时,本研究也将为人工智能在复杂知识组织领域的应用提供新的实践案例和理论启示。
1 相关工作
1.1 专利知识图谱
专利知识图谱是专门针对专利数据构建的一种知识图谱。它通过图谱的方式,有序地组织和清晰展示专利信息,同时精准识别出专利数据中的关键实体及其相互关系,为深入理解和分析专利信息提供了一种新方法[2]。该图谱不仅简化了复杂专利信息的理解过程,还提供了深入挖掘和利用专利数据的有效手段。在推动技术创新方面,专利知识图谱发挥着举足轻重的作用。它能够帮助研究人员和企业迅速把握相关技术领域的最新发展动态,明确研发方向,避免不必要的重复研发,从而加速创新进程[3]。此外,专利知识图谱还为市场分析和知识管理提供了有力支持。通过深入分析专利布局和技术演进路径,政策制定者及企业能够做出更加明智和科学的战略决策[4]。更值得一提的是,专利知识图谱还能促进跨领域的研究合作和协同创新,揭示不同技术领域和研究领域内实体与关系的联系,为发现新的研究方向和合作机会提供了可能[5]。
1.2 专利知识图谱构建方法
专利知识图谱的构建方法经历了从人工处理逐渐转变为深度学习技术的应用。在早期,构建专利知识图谱主要依赖于手动操作。赖朝安等基于关键词共现法构建了移动医疗知识图谱[3],邵泽宇等则通过Citespace和手工代码构建了区块链专利知识网络图谱[5]。尽管这些方法具有开创性,但它们面临着人力成本高、数据处理效率低以及数据覆盖范围小等挑战。随着深度学习技术的出现,专利知识图谱的构建方法取得了显著进步。吕向如将知识图谱的构建过程分为三个阶段,并运用了BiLSTM-CRF模型、基于注意力机制的BiLSTM及关键词策略,和BERT-BiGRU-CRF模型,从而成功构建了新能源汽车领域的专利知识图谱[2]。马国斌利用Bert-BiLSTM-CRF模型和Bert模型分别识别专利摘要中的实体并提取实体间的关系,构建了面向知识检索的制造业专利知识图谱[4]。曹树金等则结合了BERT模型、LDA主题模型以及Bert4keras,构建了面向创新的教育机器人专利知识图谱[6]。何玉等提出了SpERT-Aggcn模型,该模型通过提取嵌套实体并引入完整的依存文法信息,提高了关系抽取的精度,从而构建了绿色合作专利知识图谱[7]。
尽管深度学习技术在专利知识图谱的构建中展现了显著效果,推动了方法的自动化,并提升了效率和质量,但仍存在一些不足。首先,深度学习模型依赖于大量的标注数据进行训练,这在某些专利领域可能并不容易获取。其次,这类模型通常需要大量的计算资源,这在资源受限的环境中限制了其应用。最后,深度学习模型的解释性相对较弱,因此在需要深入理解模型决策过程的场景中,这可能成为一个问题。
1.3 ChatGPT在自然语言处理中的应用现状
ChatGPT的出现为专利知识图谱构建提供了新的解决方案。作为一种先进的人工智能模型,ChatGPT自发布以来就因其强大的知识学习和复杂语言逻辑理解能力而受到广泛关注。ChatGPT拥有高达1 750亿的模型参数,在专利文献的理解和生成方面,ChatGPT展现出了明显的优势。此外,ChatGPT采用的完全端到端训练模式,无需人工标注数据,非常适合进行大规模无监督预训练,从而大幅减轻了人工操作的负担。通过预训练中的对话、问答、文本生成等多种任务,ChatGPT已经获得了出色的语言理解与生成能力,能够有效应对专利文献中的复杂语言,并准确地抽取实体和关系。同时,ChatGPT对长篇幅文本具有出色的语义理解能力,能够捕捉文本的上下文逻辑关系[8],这对于理解复杂的专利文档内容具有重要意义。
此外,ChatGPT在自然语言处理领域已证实具有强大能力,并在多个相关任务中取得了显著的应用成果。作为一款生成式模型,ChatGPT在学术论文写作和创新性评价领域取得了成功应用。它不仅能够高质量地生成学术论文的引言[9]和中英文摘要[10-11],还能有效地评估论文的创新性[12],标题的语句流畅度和语义相关性[13]。同时,ChatGPT在论文摘要语法矫正、学术用语简化和规范方面也提供了有力支持[14]。在文本数据增强领域,ChatGPT也发挥了重要作用。它通过生成与原始文本概念相似但语义不同的样本,丰富了训练数据的多样性和内容[15-16],从而提升了模型训练的性能和准确率。此外,ChatGPT还能自动化标注数据并构建数据集,大幅降低了人力和时间成本,同时保证了数据集的质量和实用性[17]。
在知识管理和组织方面,ChatGPT展现了出色的自适应性,能够自动生成和组织知识内容[18],为知识管理提供了新的解决方案,并推动了知识的高效应用。ChatGPT在处理复杂数据方面也表现出色,如在电信诈骗案件的影响力评估中显示了其强大的分析能力[19]。在情感计算[20]、立场检测[21]和隐含仇恨言论检测[22]等文本分析任务上,ChatGPT的应用也体现了其对文本情绪和倾向性的深入理解能力,为这些领域提供了新的视角和方法。
另外,ChatGPT在实体提取方面展现了明显的优势。在专利技术功效实体抽取方面,结合Prompt方法,ChatGPT能有效识别和提取专利技术词、功效词及其二元组,不仅提升了专利技术功效矩阵的构建质量,也进一步展示了ChatGPT在处理复杂专利数据、进行跨领域和跨语言分析方面的强大能力[23]。此外,还有研究利用ChatGPT从司法文本中提取命名实体,为司法智能化提供了有力支持[24]。然而,这些研究并未涉及实体间关系的抽取,也未进行实体关系联合抽取或构建专利知识图谱。
综上所述,尽管ChatGPT在自然语言处理领域的应用已展现出广泛的覆盖范围和显著的优势,为学术研究、知识管理、技术应用、数据处理、文本分析和内容创作等多个方面提供了高效且创新的解决方案,但在利用ChatGPT构建专利知识图谱方面的研究仍需深入。目前,虽有研究探讨了利用ChatGPT构建法律案件知识图谱,并利用该图谱评估电信诈骗案例的影响力[19],但其核心在于法律案例影响力的评估,而非知识图谱的构建,且其研究对象是法律案例,与专利的特点存在较大差异。因此,有必要进一步探究ChatGPT在专利知识图谱构建中的具体应用效果。
本研究从专利知识图谱自动化构建的角度出发,利用ChatGPT API和提示词工程,精准抽取专利实体及其关系,并把ChatGPT信息提取能力与其他实体关系抽取技术进行对比,最终实现了专利知识图谱的可视化。通过本研究,期望能揭示ChatGPT在专利知识图谱构建中的独特优势和可能存在的局限性,从而为专利分析和知识管理领域提供更全面、高效的技术支持,并为其带来崭新的视角。
2 研究设计
专利知识图谱构建的关键在于从非结构化数据中提取实体和关系。本文利用ChatGPT API和提示词来提取信息。研究框架如图1所示。
width=541,height=367,dpi=110
图1 研究框架
2.1 数据采集与预处理
在知网专利数据库中以“智能驾驶”为关键词选择所有专利数据1 537条。去除重复数据后,剩下1 126条。专利相关数据有 “作者”“申请人”“题名”“公开号”“公开日期”“摘要”等信息。除“摘要”信息外,都是结构化数据,因此,把“摘要”作为待处理内容,让ChatGPT提取信息。
2.2 专利知识图谱构建
2.2.1 ChatGPT API
本文收集了1 126条专利摘要,且专利摘要的平均长度为255.833字,总长度为288 324字,远远超过了ChatGPT交互窗口中一次能输入的文本长度。为实现自动化专利摘要信息提取功能,本文通过API接口实现与 ChatGPT 的交互[25]。API编程方式灵活性强,提供了很多自定义选项,提高了对结果的控制能力。模型设置上选择性能较好的“gpt4”模型;为减少随机性,保持一贯性,温度控制设置为0。
ChatGPT中API使用方法如图2所示,使用Python语言通过OpenAI的API与ChatGPT模型进行交互。首先,导入OpenAI库以便能够调用API。openai_api_key变量存储了API密钥,这是使用OpenAI服务所必需的。在get_completion函数中,创建了OpenAI的客户端实例,并使用chat.completions.create方法发送聊天信息给ChatGPT模型,该方法需要指定模型名称、温度参数以及对话消息。对话消息设置了系统消息、助手消息和用户消息三个角色,构建一个模拟对话场景。三个角色的设置有助于提供上下文信息、模拟用户交互,并指导GPT模型进行更准确的响应。其中,系统消息为对话提供了背景信息和系统级的指令,有助于模型理解整体任务的框架和内容。助手消息扮演助手角色,提供了few-shot示例,指导模型提取信息。用户消息是用户角色,接受用户要发送给ChatGPT的文本。这个过程使得用户能够与ChatGPT模型进行交互,获取基于输入文本生成回复文本。
width=346,height=203,dpi=110
图2 ChatGPT API使用方法
2.2.2 提示词工程
在构造与ChatGPT模型交互的API接口函数时,本文设置了系统消息、助手消息和用户消息三个角色。其中,系统消息负责提供对话的背景信息和系统级指令,是提示词工程的主要应用场景;助手消息提供了信息抽取示例,利用few-shot示例能显著提高与大语言模型交互的效率和准确率[26]。因此,本文在系统消息中设计了提示词,在助手消息中嵌入了few-shot示例,在用户消息中提供了具体的专利摘要。
提示词工程作为一个设计、优化和细化输入提示的过程,其目标在于确保用户意图能够有效传递给如ChatGPT这样的大语言模型。它通过设计、改进和实施提示或指令的实践,引导模型输出,以助力完成各种任务[27]。提示词工程对于从模型中获取准确、相关和连贯的回应至关重要,已成为用户充分利用大语言模型并在广泛应用中取得最佳结果的关键技能[28]。在设计系统消息中的提示词时,本文遵循了设定角色、阐述背景、定义目标、给定条件[29]及规定输出格式[28]等多个原则。此外,本文还强调链式思考(Chain of Thought)原则的运用。链式思考是一种引导大型语言模型执行复杂推理任务的有效方法。它通过在提示词中融入逐步解决问题的逻辑,指导模型生成一系列反映问题逻辑结构的中间推理步骤,进而提高答案的准确性,同时使问题解决过程更加透明和可解释[27]。
基于以上原则,本文设计了如图3所示的提示词。首先,基于设定角色,阐述背景和定义目标的原则,在任务描述中,将执行任务的角色设定为知识图谱领域的专家,确保任务执行者能从专业的视角出发处理问题。背景被设定为智能驾驶领域的专利摘要处理,为任务提供了明确的专业背景和必要的上下文。定义了一个清晰的目标,即从专利摘要中提取实体和关系,实现了对任务目标的明确界定。
width=671,height=463,dpi=110
图3 提示词工程
其次,基于给定条件原则,为确保实体和关系定义和分类的准确性,充分参考资料,深入了解专利摘要。结合中国汽车工程学术研究综述[30]对智能驾驶的分析,利用LDA主题模型[31],参考智能驾驶领域专家建议把智能驾驶领域的实体分成专利、硬件技术、软件技术、环境感知与定位、决策与规划、运动控制、车路协同、安全技术、人机交互、测试与评价、技术创新、其他实体12种不同的实体。
在确定实体类型后,需要明确实体间的关系。根据对专利数据的词频统计结果,专利摘要中包含了323种不同的关系表述。为有效归类和整理这些关系,本文采取了以下处理步骤。第一,利用Word2vec模型对专利文本进行词向量训练。Word2vec是一种通过训练神经网络学习词向量表示的模型,能够将词汇转化为向量形式,捕捉词语间的语义关系[32]。第二,基于Word2vec的训练结果,计算了关系间的相似度,设定0.8为相似度阈值。对相似度高于此阈值的关系进行合并,以减少关系冗余和重叠。第三,采用K-Means算法[33] 对合并后的关系进行聚类分析。聚类结果如图4所示,当聚类数K为6时,聚类内误差平方和(WCSS)的下降速度显著放缓。
width=433,height=203,dpi=110
图4 Kmeans聚类的结果
根据“肘部法则”,这表明聚类数K为6时,聚类效果最优,能清晰反映关系的内在结构。但考虑到可能存在未被明确归类的关系或未来潜在的新关系类型,本文增设了一个“其他关系”的类别。最终,确定了7种不同的关系类型,分别为组成部分、实现途径、流程步骤、功能用途、物理结构、创新点,以及其他关系。这些实体和关系的定义和分类作为限定条件,为信息提取和处理提供了明确指导,确保了信息处理的准确性和一致性。
最后,要求以特定JSON格式输出提取的实体和关系,规范了数据的表现形式,确保了数据的后续处理和有效利用。
2.3 评价指标
基于ChatGPT API和提示词工程提取的五元组信息可靠性与否通过精确率(Precision)、召回率(Recall)和F1值来评估,计算公式如式(1)~(3)所示。与一般的分类模型不同,信息提取任务是提取句子中{“subject”、 “subject_type”、 “object”、 “object_type”、 “predicate”}这五元组,不是二分类或多分类问题,没有假正例(False Positives) 或假反例(False Negatives)。因此,五元组任务的精确率衡量了预测正确的五元组数量占预测总五元组数量的比例;召回率衡量了模型能够正确预测出多少真正的正例;而F1值是精确率和召回率的调和平均数,用于综合评估模型的性能,考虑了精确率和召回率的平衡。
width=231,height=32,dpi=110
(1)
width=184,height=32,dpi=110
(2)
width=178,height=35,dpi=110
(3)
式中:TruePositives表示真正例;TotalPredicatedPositives表示总的预测正例;TotalActualPositives表示总的实际正例。
3 实验结果
3.1 基于ChatGPT的生成结果
基于ChatGPT对1 126个专利摘要生成了12 148个五元组信息,平均每个专利生成了约11个五元组,生成的内容较为丰富。生成的部分结果如表1所示。从表1可知,ChatGPT生成结果与标注结果在描述上基本一致,ChatGPT对每个句子都生成了信息,subject_type和predicate的生成结果和标注结果重合度较高。生成结果中的“换道轨迹拟合方程即为本智能驾驶换道轨迹生成方法的最终输出结果”的object_type被分为“运动控制”,而标注结果中则将其归类为“软件技术”。这可能是因为生成结果更侧重于结果的描述,而标注结果则更强调其在智能驾驶系统中的作用。
表1 ChatGPT生成五元组和人工标注五元组
width=704,height=264,dpi=110
3.2 ChatGPT与Bert2Keras提取结果对比
为客观评价ChatGPT在实体关系抽取任务上的性能,探讨其在构建知识图谱的可行性,本文选择Bert2Keras作为基线模型进行对比分析。BERT,作为一种基于Transformers架构的预训练模型,已在大规模无标注语料上进行了深入训练,能够捕捉到深层次的语义信息[34]。Bert2Keras库[35]是基于Keras的便捷工具,用于加载和应用BERT模型。本文使用Bert2Keras库实现实体与关系联合提取,并对比了ChatGPT与Bert2Keras在精确率(Precision)、召回率(Recall)和F1值这3个关键指标上的表现。在数据划分方面,把原始数据集按8∶2的比例划分,训练集914个,测试集212个。两个模型在测试集上的对比结果如表2所示。由表2可知,ChatGPT在所有3个指标上的表现均明显优于Bert2Keras,特别是在召回率和F1两个指标上展现出卓越性能。研究结果表明,ChatGPT在理解复杂任务以及提取实体和关系方面具备显著优势,因此,利用ChatGPT来构建知识图谱是完全可行的。
表2 ChatGPT与Bert2Keras性能对比
width=346,height=70,dpi=110
3.3 专利知识图谱构建
使用ChatGPT进行实体关系抽取,得到12 148个包含subject、subject_type、 object、 object_type、 predicate信息的五元组。为实现专利核心信息的可视化,从五元组中提取subject、 predicate、 object三元组,剔除类别信息,只保留关键的实体和关系信息。随后,把三元组转换为csv格式,导入到Neo4j, 得到专利知识图谱(如图5所示)。专利包含了丰富的实体和关系,通过知识图谱将实体信息通过关系链接起来,形成一个直观的网络结构。利用图谱,可以更容易地发现数据之间的隐藏模式和关系。此外, Neo4j支持Cypher语句高效进行图遍历操作,对于复杂的查询特别有优势。传统的关键词搜索可能不足以准确反映复杂的查询意图,而知识图谱能提供语义上的联系和上下文,帮助改进搜索结果。
width=346,height=181,dpi=110
图5 专利知识图谱
本文利用ChatGPT对专利文献进行深度理解、抽取关键信息并构建专利知识图谱,实验结果显示,ChatGPT在概念识别以及非结构化数据生成等方面表现出显著优势。相较于Bert2Keras的传统方法,ChatGPT能够更准确地理解和提取专利文档中的创新点,实现途径,组成部分,功能用途等多元信息,利用ChatGPT能高效构建出高质量的知识图谱。尤其在处理复杂专利描述文本时,其强大的自然语言处理能力有助于减少人工干预,提高了知识图谱构建的自动化程度和准确性。
4 结 语
本文利用ChatGPT API和提示词工程成功构建了专利知识图谱,结果表明ChatGPT拥有出色的语义理解和知识建模能力,非常适用于专利知识图谱的自动化构建。这一成果不仅为大型语言模型的应用开辟了新领域,还为专利信息的有效整合与利用提供了创新思路和技术支持。借助ChatGPT的强大功能,专利知识图谱构建技术将得到显著提升,进而推动知识产权管理、技术研发及市场竞争情报分析等相关工作的智能化发展,为企业和科研机构制定更精准的战略决策提供有力支撑。尽管ChatGPT在构建专利知识图谱方面取得了积极成果,但仍存在一些挑战。首先,为了更充分地利用和挖掘专利知识图谱的价值,需要将其应用进一步扩展到个性化推荐、知识问答、知识推理等更多场景。其次,由于专利文献具有高度的专业性和多样性,这就要求模型必须具备更强的领域适应能力。此外,对于模糊表述或隐含关系的深入挖掘,以及大规模专利知识图谱的实时更新问题,也亟待解决。针对这些挑战,未来的研究方向可以考虑结合预训练模型与领域专业知识进行微调,研发更为精确的上下文感知关系抽取算法,并探索增量式图谱构建策略,以不断提升专利知识图谱的构建质量与应用效果。
参考文献
[1] Siddharth L, Li G, Luo J. Enhancingpatent retrieval using text and knowledge graph embeddings: A technical note[J]. Journal of Engineering Design, 2022, 33(8/9): 670-683.
[2] 吕向如. 中文专利知识图谱构建研究[D]. 北京: 北京信息科技大学, 2019.
[3] 赖朝安, 钱 娇. 基于知识图谱的专利挖掘方法及其应用[J]. 科研管理, 2017, 38(1): 333-341.
[4] 马国斌. 基于知识图谱的专利知识检索研究[D]. 哈尔滨: 哈尔滨工业大学, 2021.
[5] 邵泽宇, 孟天宇. 基于知识图谱的区块链专利数据挖掘[J]. 技术与创新管理, 2020, 41(6): 588-595.
[6] 曹树金, 李睿婧. 基于专利文献摘要的创新知识图谱构建与应用[J]. 情报理论与实践, 2022, 45(11): 21-28.
[7] 何 玉, 张晓冬, 郑 鑫. 基于SpERT-Aggcn模型的专利知识图谱构建研究[J]. 数据分析与知识发现, 2024, 8(1): 146-156.
[8] OpenAI. Chat GPToverview[EB/OL].[2024-03-29].
[9] 郭 鑫, 王一博, 王继民. ChatGPT生成中文学术内容分析——以情报学领域为例[J]. 图书馆论坛,2024,44(3):134-143.
[10] 王一博, 郭 鑫, 刘智锋,等. AI生成与学者撰写中文论文摘要的检测与差异性比较研究[J]. 情报杂志, 2023, 42(9): 127-134.
[11] Gao C A, Howard F M, Markov N S, et al. Comparingscientific abstracts generated by ChatGPT to original abstracts using an artificial intelligence output detector, plagiarism detector and blinded human reviewers[J]. BioRxiv, 2022: 2022.521610.
[12] 王雅琪, 曹树金. ChatGPT用于论文创新性评价的效果及可行性分析[J]. 情报资料工作, 2023, 44(5): 28-38.
[13] 吴 娜, 沈 思, 王东波. 基于开源LLMs的中文学术文本标题生成研究—以人文社科领域为例[J]. 情报科学, 2024,42(7):137-145
[14] 李侗桐, 高瑞婧, 田 佳. ChatGPT在中文科技期刊摘要文字编辑中的实用性测试与分析[J]. 中国科技期刊研究, 2023, 34(8): 1014-1019.
[15] Dai H, Liu Z, Liao W, et al. Auggpt: Leveraging ChatGPT for text data Augmentation[J]. ArXiv Preprint ArXiv,2023:2302.13007.
[16] 张 恒, 赵 毅, 章成志. 基于SciBERT与ChatGPT数据增强的研究流程段落识别[J]. 情报理论与实践, 2024, 47(1): 164-172,153.
[17] 商锦铃, 张建勇. 基于ChatGPT和提示工程的查询式摘要数据集AMTQFSum构建研究[J]. 数据分析与知识发现,2024,8(Z1):122-132.
[18] 曹茹烨, 曹树金. ChatGPT完成知识组织任务的效果及启示[J]. 情报资料工作, 2023, 44(5): 18-27.
[19] 裴炳森, 李 欣, 吴 越. 基于ChatGPT的电信诈骗案件类型影响力评估[J]. 计算机科学与探索, 2023, 17(10): 2413-2425.
[20] Amin M M, Cambria E, Schuller B. Willaffective computing emerge from foundation models and general AI: A first evaluation on ChatGPT[J]. ArXiv Preprint ArXiv, 2023: abs/2303.03186.
[21] Zhang B, Ding D, Jing L. Howwould stance detection techniques evolve after the launch of ChatGPT?[J]. ArXiv Preprint ArXiv, 2022:2212.14548.
[22] Huang F, Kwak H, An J. Is ChatGPTbetter than human annotators? potential and limitations of ChatGPT in explaining implicit hate speech[C]//Companion Proceedings of the ACM Web Conference 2023, 2023: 294-297.
[23] 白如江, 陈启明, 张玉洁, 等. 基于ChatGPT+Prompt的专利技术功效实体自动生成研究[J]. 数据分析与知识发现,2024,8(4):14-25.
[24] 田萍芳,刘恒永,高 峰,等.基于大语言模型的本体提示指导的司法命名实体识别[J/OL].武汉大学学报(理学版),2024:1-13[2024-06-19].
[25] OpenAI API. Introduction docs for openAI aPI[EB/OL].[2024-03-25].
[26] Brown T, Mann B, Ryder N, et al. Languagemodels are few-shot learners[J]. Advances in Neural Information Processing Systems, 2020, 33: 1877-1901.
[27] Wei J, Wang X, Schuurmans D, et al. Chain-of-thought prompting elicits reasoning in large language models[J]. Advances in Neural Information Processing Systems, 2022, 35: 24824-24837.
[28] Ekin S. Promptengineering for ChatGPT: A quick guide to techniques, tips and best practices[J/OL]. [2024-03-29].
[29] Meskó B. Promptengineering as an important emerging skill for medical professionals: Tutorial[J]. Journal of Medical Internet Research, 2023, 25: e50638.
[30] 《中国公路》编辑部.中国汽车工程学术研究综述·2023[J].中国公路学报,2023,36(11):1-192.
[31] Blei D M, Ng A Y, Jordan M I. Latentdirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3(1): 993-1022.
[32] Mikolov T, Chen K, Corrado G, et al. Efficientestimation of word representations in vector space[J]. ArXiv Preprint ArXiv, 2013:1301.3781.
[33] Kodinariya T M, Makwana P R. Review ondetermining number of cluster in K-means clustering[J]. International Journal, 2013, 1(6): 90-95.
[34] Devlin J, Chang M W, Lee K, et al. BERT: Pre-training of deep bidirectional transformers for language understanding[J]. ArXiv Preprint ArXiv, 2018:1810.04805.
[35] SU J. Bert4Keras[EB/OL].[2024-03-25].
Construction of Patent Knowledge Graphs Based on ChatGPT API and Prompt Engineering
Zhang Lingling Huang Wulan
(School of Business Information, Shanghai Business School, Shanghai 200235)
Abstract:[Research purpose] In the context of the information explosion era, the rapid growth of patent data presents new challenges for knowledge management and analysis. This study aims to explore the use of ChatGPT for information extraction from patent abstracts to construct patent knowledge graphs, thereby enhancing the efficiency and accuracy of knowledge management and analysis. [Research method] Patent abstracts in the field of intelligent driving were selected from the China National Knowledge Infrastructure (CNKI) patent database, and ChatGPT was utilized for information extraction. To achieve efficient batch processing, the ChatGPT API was used for interaction. To ensure the accuracy of information extraction, multiple iterations and optimizations of prompts were performed, designing three roles: system messages, assistant messages, and user messages. These roles guided the model to accurately extract entities and relationships through simulated dialogue scenarios.[Research result/conclusion] The results indicate that ChatGPT successfully extracted rich quintuple information from 1126 patent abstracts and constructed a patent knowledge graph based on this information. Compared with traditional methods such as Bert2Keras, ChatGPT demonstrated significant advantages in key metrics such as precision, recall and F1-score, achieving 88.2%, 88.3% and 88.3%, respectively, far surpassing Bert2Keras's 34.7%, 9% and 14.6%. Finally, using the extracted entities, relationships and Neo4j technology, a knowledge graph was successfully constructed and visualized, facilitating query operations through Cypher statements. This study not only confirms the feasibility of using ChatGPT in patent knowledge graph construction but also lays the foundation for its intelligent application in intellectual property management, technological development, and competitive intelligence analysis.
Key words: ChatGPT API; prompt engineering; patent knowledge graph; entity and relation extraction; intelligent driving
收稿日期:2024-06-03
修回日期:2024-06-24
基金项目:国家社会科学基金一般项目“面向智库建设的图书馆知识服务模式和创新路径研究”(编号:18BTQ058)研究成果。
作者简介:张玲玲,女,1988年生,博士,讲师,研究方向:生成式人工智能、机器学习;黄务兰,女,1979年生,博士,副教授,研究方向:知识管理。
中图分类号:G251
文献标识码:A
文章编号:1002-1965(2025)03-0180-08
引用格式:张玲玲,黄务兰.基于ChatGPT API和提示词工程的专利知识图谱构建[J].情报杂志,2025,44(3):180-187.
DOI:10.3969/j.issn.1002-1965.2025.03.022
(责编:王育英;校对:刘影梅)