大语言模型视野下的历史文物数据理解与交互

李福临
论文
2025-12-06
611热度
0评论

摘要：将最新人工智能技术与历史文物数据库相结合，利用ChatGPT构建专注于历史文物的智能问答系统，推动博物馆数字化转型。通过数据提取与预处理、导入Neo4j图数据库构建知识图谱、利用LangChain平台调用大语言模型，系统实现对历史文物的初级对话能力。经精细调整模型参数，模型实现在历史博物馆领域对话能力的定向增强，保证了输出信息准确性、专业性，优化输出自然语言的连贯性。人工智能与历史博物馆相结合，不仅促进科学历史知识传播，提升公众对历史文物的认知，也为传统文化与人工智能技术结合提供了有益尝试，为传统文化注入新的生机与活力。

关键词：博物馆；ChatGPT；LangChain；知识图谱；数字人文

一、问题的提出

近年来，在各级政府部门的支持下，中国博物馆事业取得了显著进展。利用现代信息技术对博物馆文物赋能，是提高博物馆服务水平的一条有效途径。就目前现实情况而言，博物馆在信息技术应用方面主要呈现出两种互动模式：单向互动与双向互动。单向互动是指博物馆借助数字手段，对布局、展示方式等进行优化，再辅助以传达文物信息的介绍性文字，旨在提升游客的参观体验。这种模式是博物馆传统服务模式的延续，以“物”作为核心，游客处于被动接受一方。双向互动则突破传统，意味着游客与文物直接进行交互，通过交谈的方式，游客可以获取个性化探索文物的服务体验。双向模式更加强调主动性，将游客置于探索和学习的中心，构建以“人”为核心的全新博物馆服务模式。简言之，单向互动强调博物馆通过数字手段增强观众观看体验；双向互动侧重游客与文物之间的互动体验，带来更富个性化和主动性的探索学习经历。这两种模式的区分，为博物馆在信息时代，探索更宽泛、更具互动性、参与性的游览体验提供了清晰路径，为博物馆文物文化传播、集成以及数字化演进提供了更智能化发展空间。

目前，国内对于博物馆数字化不管是理论研究还是实际应用主要集中在单向互动模式方面。姚菲提出在成都金沙遗址博物馆建立智慧化博物馆，通过VR沉浸式体验、门户网站美化完善以及智能终端数字门票等方式，提高游客观览的满意度。^[^1]李祥等学者提出博物馆通过提高硬件设施，实现纯实物静态展示、声光电影像动态展示等，为游客创建一个沉浸式游览体验过程。^[^2]顾振清等学者围绕元宇宙在虚拟展示、数字藏品等多方面进行了讨论，提出了对未来博物馆事业的设想。^[^3]但是种种设想与建设，仍然是停留在单向互动层面。

ChatGPT技术的迅速发展，为博物馆游览的双向互动提供了可能性。参观者可以主动向文物提出自己所想要了解的内容，文物根据自身数据储备来回复游客。不过，ChatGPT技术应用于博物馆存在着诸多困难与挑战。周鼎凯等学者谈到了目前以 ChatGPT 为代表的自然语言处理技术在博物馆领域中所遇到的挑战，如何让机器回答问题时模型的处理速度更快、性能更稳定，如何让问答系统回答文物信息含义时不出现歧义、回答更自然，如何让机器给出的答案专业性更强、精确度更高、藏品数据更安全等困难。^[^4]这些都是双向互动模式所面临的必须解决的问题。本文将收集数据、设计实验、构建模型来解决这些困难。通过收集数据，对其预处理之后整理为知识图谱，作为LangChain调用大语言模型（ChatGPT）的数据集，最终实现对话功能，以此为博物馆的智能化做出努力，也是对前人所提出困难与挑战的回应。

二、应用技术介绍与实验原理说明

（一）实验原理说明

本文旨在构建一个历史文物领域的人工智能对话系统，以满足游客在博物馆中与文物进行双向互动的游览体验。该系统是综合多个关键技术领域而完成的，从信息采集、数据库构建、对话系统初步实现、到最终对话能力的定向增强，建构了一个高效、准确、专业的历史领域的人工智能对话系统（详见图1 技术总括流程图）。

系统起始步骤是相关文物信息的采集和预处理。采集阶段采用两种不同方式：一是利用网络爬虫技术，该方法能够快速从互联网上获取丰富的历史文物资源知识，并将其高效批量保存；二是采用手动摘录的方式，对不便于通过爬虫技术进行批量处理的文本，手动检索并输入，使得数据最终被收录数据库之中。在数据预处理阶段，因为文物信息多、外延广，作者会总结出具有同一性关键词对文物进行标签。通过这些标签，剔除无关信息，生成简洁且结构化的数据集。经过处理的数据以CSV格式保存，为构建知识图谱做好了准备。

系统的第二步骤是知识图谱构建，该图数据库是整个系统的重要组成部分。知识图谱构建是将预处理后的数据（CSV）文件根据数据库需要将其转化为Cypher 语言，确立中心节点与各分支节点的所属关系，以及分支节点的文物信息，最终成功建立文物信息的知识图谱。该图数据库的建立为系统提供了强大的查询和连接能力，使得用户对复杂多联的文物信息数据可以进行高效地检索。

系统构建的第三步是连接Neo4j数据库（即上文所述知识图谱）与大型语言模型（GPT3.5），利用LangChain技术来调用LLM模块，实现初级的对话功能。为了使对话系统更具专业性，需要对Python第三方库GraphCypherQAChain中函数进行针对性的精细调整。调整具体包括：限定模型回答局限于提供的数据集、赋予模型历史文物导游的身份、预先设定回答的风格和语调。这样的定向增强使得系统在特定博物馆领域中表现出更高水准的专业性和自然性。

图1 技术总括流程图

（二）应用技术介绍

1.ChatGPT技术概述

ChatGPT技术是OpenAI公司开发的一项基于人工智能的自然语言处理技术，构建在深度学习模型的基础上，旨在实现智能对话。^[^5]虽然ChatGPT在人机交互的便捷性方面表现出色，但它也有其他一些困难。例如理解上下文是一个复杂的问题、系统可能无法准确捕捉长篇对话中的细微变化、生成的回复可能会缺乏合理性等，这都需要进一步优化从而提升智能回答的质量。值得说明的是，ChatGPT技术为了弥补自身在特定领域回复能力不足的缺陷，同时开放API接口，使得开发者可以通过调用ChatGPT的API接口，实现数据共享、功能扩展和整合，从而创造更丰富、更强大的应用程序。

2.LangChain技术概述

LangChain是一个基于大语言模型驱动的框架技术系统，旨在为快速应用开发提供便利。主要有两大功能：将语言模型链接到其他数据源；允许语言模型与其环境进行交互。^[^6]通过LangChain框架，研究者可以调用大语言模型的API，来回答自身数据集的问题。使用LangChain技术来搭建历史博物馆智能聊天系统需要关注两点：数据库建设，以满足特定需求；灵活应用LangChain中各种模型的方法和技巧，以提高效果。LangChain技术不仅为那些计算机技术了解有限的研究者提供了便捷，还为有志于构建训练自身大语言模型的工作者提供了一个模型训练预设的结果。

3.知识图谱技术概述

Neo4j是专注于图数据的存储和处理的图数据库管理系统。该技术通过“节点”和“关系”的方式，将数据以图形的形式呈现，强调数据实体之间的关系网络。^[7]Neo4j技术为复杂关系数据的建模、查询与分析提供了卓越的解决方案。强大的Cypher查询语言是Neo4j的一大亮点。通过Cypher技术，用户可以轻松地提取节点、关系和路径、执行数据的增删改操作；还允许用户灵活地执行关系模式匹配，发现潜在的数据关联。通过Neo4j的API，开发人员可以将Cypher查询嵌入到应用程序中，实现对图数据的操作和查询。这种无缝的集成能力使得应用程序能够充分利用图数据库的优势，实现更深入的数据分析和洞察。

4.LangChain Cypher模块介绍

LangChain Cypher这一模块是为了优化智能回答内容，而将Neo4j中Cypher技术与 LangChain 技术的综合。作为LangChain链下的一个重要组成部分，它的主要功能是实现自然语言和Cypher查询语言之间的双向转化。从而极大地提升数据库的可访问性，也显著提高了用户的体验。此模块可大致划分为五个关键步骤（如图2 Cypher Search流程图所示）。这一流程实现自然语言与图数据库之间的无缝交互，提供给用户高度专业的文本知识体验，让人工智能在历史专业领域的运用更有前景。

图2 Cypher Search流程图

三、历史文物领域ChatGPT构建

本文采用信息检索方法，从历史文物数据中提取信息，并将其存储为CSV文件。之后，作者将CSV文件导入Neo4j图数据库，并生成Cypher查询语言以建立知识图谱。随后将这个知识图谱集成到LangChain中，以便通过调用相关函数，实现自然语言对历史文物数据的结构化检索。最终成功建立了一个面向历史博物馆领域的智能问答系统。这一系统具备多方面的优势，诸如低代码开发、低成本维护以及快速实施的特点。在问答过程中，该系统以实事求是、专业度高、精确性强为特点，确保了人工智能在回答涉及历史文物问题时的高质量表现。

（一）历史文物数据收集与处理

本实验选择二里头博物馆的珍品文物作为数据集的来源，共八件文物。这些文物样本具有知名度，又是夏文化象征。在实验中能够简化数据收集过程，也能保持数据的丰富性、典型性。

构建图数据库需要先对文物进行标签标注。本实验对二里头博物馆官网的珍品馆内文物信息进行手动检索后获取基本的数据集（由于数据量不大，所以均采用手动检索的方式）。通过对文物信息的收集以及整理，根据实验需要，对文物进行标注。标注分类主要项：文物名称、馆藏单位、时代、出土时间、出土地点、尺寸、形状以及用途（详见附录1）。这些标签的目的在于更好地描述文物的属性和历史背景。具体而言，以骨猴文物为例，他的属性可以描述为表1的形式（见表1骨猴文物属性），其中每一个属性都包含明确的值，有助于更清晰地表达文物所包含的信息。实验中每个文物都按照表1的标准，对数据进行结构化处理，并创建一个CSV格式的数据存储文件，包含所有文物的信息。在CSV文件中，系统设计遵循通用的数据处理和存储规范，以便与计算机程序和数据库系统更好地配合，所以数据存储中属性均以英文表示（详见表2文物属性的英文标识）。

表1骨猴文物属性

文物属性	信息详情
文物名称	骨猴
馆藏单位	二里头博物馆
时代	二里头文化
出土时间	2002年
出土地点	偃师二里头遗址ⅤT26M6出土
尺寸	高2.2、宽0.75—0.95厘米
形状	使用动物骨骼雕刻制作，通体抛光，制作精巧，栩栩如生

表2文物属性的英文标识

英文标识	文物属性
id	文物的唯一标识符
name	文物名称
museum	馆藏单位
era	时代
excavation_year	出土时间
excavation_site	出土地点
size	尺寸
shape	形状
purpose	用途

（二）历史文物图数据库构建

数据信息处理完后，需要创建历史文物知识图谱，也就是历史文物图数据库的构建。本实验通过Cypher语言，将已经收集好且经过结构化处理过的数据导入至Neo4j图数据库之中，并创建一个“历史文物知识图谱”数据库。在这个图谱中以“二里头博物馆文物”作为中心节点，代表了整个文物集合。每个文物都与这个中心节点相连接，表示它们隶属于这一馆藏单位（见图3 历史文物知识图谱）。需要说明的是，将博物馆作为中心节点往往是一个不错的选择，既有利于当前知识图谱的维系，同时具有很强的扩展性，伴随着后续数据的增多，仍可以选择“博物馆”作为中心节点，而各个博物馆作为二级节点。

图3 历史文物知识图谱

根据上图（图3历史文物知识图谱）即可对文物数据有清晰的认知：在中心位置的是“二里头博物馆文物”，其他八个文物错落有致地环绕在“二里头博物馆文物”周围，并各自通过箭头“BELONGS_TO” 指向中心节点，表示各个文物均属于“二里头博物馆文物”之中。点开单个文物，也可看到单个文物的详细资料，即显示类似于表1的信息数据。最终实现将各个文物以结构化的形式对各位读者进行介绍实验目的。

综上所述，本研究采用CSV文件对历史文物信息进行了有效的知识结构化处理，将原始数据转化为符合Cypher语言规范的格式。Cypher语言被广泛用于Neo4j图数据库的数据操作和查询，因此成功地构建了二里头珍藏文物的图数据库。这标志着历史文物的人工智能问答系统第二环节：知识图谱构建完成。

接下来，实验将基于已经创建完成的图数据库，利用LangChain技术将数据库导入，并调用ChatGPT的API接口，使得ChatGPT可以顺畅接收到图数据库信息。这一步骤将能够实现与历史文物数据相对话以及交互的功能，为历史博物馆数字化创新以及诸多有望于文本交互的领域提供了更广泛的应用前景。

（三）历史文物对话系统构建

建立图数据库是对松散的文本数据资料进行结构化处理的关键步骤。结构化处理目的是提高深度学习的效率，使其能够更快速地理解和识别文本数据。这一步骤是实现与历史文物对话系统构建的重要组成部分，为对话系统搭建奠定基础。人机交互功能的实现需要完成三个任务。首先，通过调用大型语言模型（LLM）模块，利用ChatGPT的API获得对文字的理解能力。其次，利用LangChain Cypher技术实现自然语言和Cypher查询语言之间的双向转化，从而使用户通过自然语言的方式对图数据库内容进行查询。最终通过对GraphCypherQAChain库中函数进行微调实现对人工智能自然语言的语气调整，以更好地适应实际使用场景和用户需求。这个过程旨在提供更加贴近实际的对话体验，使用户能够轻松地与历史文物的知识图谱进行互动和查询。

具体实验过程是，将数据内容（详见附录1）经过编写代码转化为Cypher查询语言形成图数据库（详见附录2）。然后通过在本地调用GraphCypherQAChain库实现LangChain Cypher模块（见表3 Cypher Search工作展示）。具体介绍如下：先是用户提出请求，需要得到在数据库当中用途是装饰品的文物；之后该自然语言经过转化，变为了Cypher查询语言；查询到匹配到文物（Artifact），文物隶属（BELONGS_TO）于博物馆（Museum）之中，在博物馆之中，寻找用途（purpose）是装饰品的文物，并返回他的名字（name）；结果是一个以列表形式返回的结果，在得到的结果中共有两个文物符合用户请求，分别是“白陶斗笠形器”和“骨猴”；最终系统将这些信息组织成文本“白陶斗笠形器和骨猴都是功能是装饰品的文物。”形成自然语言答案输出。

表3 Cypher Search工作展示

工作流程

代码展示

函数调用

print(chain.run("""给我说一下功能是装饰品的文物有哪些？"""))

结果展示

> Entering new GraphCypherQAChain chain...

Generated Cypher:

MATCH (a:Artifact)-[:BELONGS_TO]->(m:Museum)

WHERE a.purpose = '装饰品'

RETURN a.name

Full Context:

[{'a.name': '白陶斗笠形器'}, {'a.name': '骨猴'}]

> Finished chain.

白陶斗笠形器和骨猴都是功能是装饰品的文物。

上述的实验过程，成功实现了前两个关键任务：将用户提出的自然语言查询转化为可执行的Cypher查询，然后在数据库中进行搜索；将从数据库中检索到的结果转化为自然语言进行输出，以满足用户的需求。这两个任务的完成也就实现对文本数据集的初级对话能力。

不过，确保最终机器回答的语言文本输出与人类正常表达相符仍然是一个挑战。本实验将通过对Python第三方库GraphCypherQAChain中函数的精细调整，比如限定模型回答局限于提供的数据集、给予模型历史文物导游的身份、对模型回答语句的风格、色彩等进行预先干预等。目标是确保最终的自然语言输出更加贴合历史博物馆的实际情境，使自然语言表达更加自然和流畅，以更好地适应历史博物馆文物的应用场景，满足用户的高度专业化需求。

为了提高回复语言的可读性以及流畅性。在本研究中，作者通过将GraphCypherQAChain类拆解后发现在该类中包含了五个参数：“cls”、“llm”、“qa_prompt”、“cypher_prompt”、“**kwargs”。其中，“qa_prompt”是一个BasePromptTemplate类型的参数，用于指定问题回答任务的提示（prompt），对系统语言回答风格起重大的影响。BasePromptTemplate是一些预定义的模板，用于构建问题回答的输入。进一步拆解BasePromptTemplate中的函数CYPHER_QA_PROMPT，发现它由两个参数组成：“input_variables”和“template”。模板字符串“CYPHER_QA_TEMPLATE”包含信息和问题两个部分，其中问题部分会根据输入内容进行填充，而信息部分则用于约定和说明问题回答的背景信息。通过微调信息部分（详见附录3），本实验成功使语言更贴近博物馆应用场景，从而实现了更自然、富有形象的回答（详见表4 Cypher Search微调后结果对比）。微调后的回答不仅增加了修饰性的形容词，还运用了诙谐的语言和比喻等修辞手法，但同时保持了文物描述的准确性。这一调整使得人工智能回答更符合正常语言表达，从而提升了用户体验，满足了本研究的预期效果。这个版本更加简洁，着重突出了关键信息，提高了可读性。

总之，通过对函数的精细调整，系统得以在特定历史博物馆领域中实现对话能力的定向增强，进一步提升历史文物对话系统的专业性和实用性；也可以更好地适应实际使用场景，满足用户需求；为用户提供更加贴近实际的对话体验，能够轻松地与历史文物的知识图谱进行互动和查询。

表4 Cypher Search微调后结果对比

微调过程	微调结果
微调前	骨猴外观是使用动物骨骼雕刻制作的，通体抛光，制作精巧，栩栩如生。
微调后	骨猴的外观可以用"栩栩如生"来形容。它是使用动物骨骼雕刻制作的，通体抛光，制作精巧。这些细节使得骨猴看起来非常逼真，仿佛栩栩如生的动物一样。它的外观细节被精心雕刻，使得它更加引人注目和独特。

（四）历史文物对话系统评估

这个系统在准确率方面表现出色，对于知识性回答几乎能够做到零错误。系统的回答主要依赖于对数据库内容的查询，当查询的内容超出了数据库所包含的数据范围时，系统会触发预先设定的函数，向提问者回答“对不起，我并不知道此内容”。此策略有效地避免虚构历史知识，保证历史信息的准确性和可信度。

困惑度值是用于评估语言模型质量的指标之一。较低的困惑度说明语言模型对文本的预测能力较好，而较高的困惑度则表示模型的性能较差。困惑度值是一个相对概念，并不是绝对概念，没有一个固定的阈值来判断性能。本实验将由作者根据提问后输出的Cypher查询语言得到的结果，编写一段自然语言，后分别计算其困惑度值。得到结果，作者组织生成的自然语言得分为32分，而由本系统生成的自然语言得分在44.999分，该分差仍保留在一个合理的区间之内，由此证明，本系统生成的自然语言流畅度可以被认可。

本系统在准确性和流畅度方面均表现出较好的效果，基本达到本实验预期结果。这些实验结果数据为后续系统的进一步开发提供了基础数据支持，这些成果为历史文物知识图谱的构建和未来研究提供了坚实的基础。该对话系统确保了历史文物信息输出的准确性和专业性，也优化了输出内容的自然流畅性。

四、结语

本文通过实验，对周鼎凯文章中所提出的构建博物馆领域知识库方面的挑战、计算机深度学习优化模型和算法验证方面的挑战，基本得到解决，实验相对成功。图数据库的建立，确保了文物信息资料的精准性，也有助于机器的深度学习。在精细调整GraphCypherQAChain的某些参数后，智能问答系统的回答更为贴合实际，既保证了文物信息的准确性，又展现出自然语言的生动性。实验结果表明，本智能问答系统可以提升游览用户的体验感、满足探索欲，加强用户与历史文物之间双向互动。本智能问答系统有望在实际应用得到广泛推广。需要说明：

第一，此次实验集成了各类人工智能工具。通过知识图谱建立结构化数据库、通过LangChain快速搭建了一个对话系统的框架、通过ChatGPT的大语言模型实现理解文本以及对话的功能。最终集成了一个微型的应用于历史博物馆领域的人工智能对话系统。

第二，本实验为博物馆游览的双向互动提供了可能。此项技术的应用，突破目前博物馆文物旅游瓶颈，使游客能够深层次、立体化体验和感受文物历史文化内涵。在夯实文化自信、建设文化强国的时代背景之下，对博物馆数字化进行设计与推广，推动文旅结合，宣传优秀传统文化，做出自己贡献。也有助于加强文物的收藏、研究、阐释到传播利用“四位一体、前后贯通”的传播利用体系建设，推动中国博物馆实现由数量增长向质量提升转变。

第三，本实验是专业领域人工智能问答系统的全面升级。通过数据库对文物的收集和整理，解决了与博物馆有关的智能问答系统中所提出的专业性强、精准度高的技术问题；引用知识图谱，将零散的知识进行结构化，减少了机器学习所要花费的时间，提高了模型训练效率；引用LangChain技术，通过第三方工具，调用大语言模型，规避了以往机器学习训练模型所要花费的大量的时间成本以及设备成本，同时可以调用优质模型，提高回答质量；最终三者结合达到了人工智能问答系统的全面升级换代。

第四，本项目是一个范本。文本中包含数据获取、数据标注、结构化处理、知识图谱构建以及导入LangChain之中形成对话系统等诸多方面的操作，后继效应明显。后来学者，不需要再对项目底层架构做出大调整，只需搜集获取完整的数据，对数据进行标注后，套用本系统模板，即可实现一个低成本、效率高、出错率低的人工智能对话系统。

第五，对于博物馆系统的搭建，仍然存在两个问题有待解决。一是数据问题。博物馆拥有大量的文物数据，但是如何对文物数据进行结构化处理，即本系统中将文物资料分为名称、馆藏单位等这一环节。面对海量的文物数据，如何找到他们之间的更多共性，进而可以进行更多地标注，帮助完善结构化数据集，使得机器对于文物地描述更加完整。本系统由于没有太多的文物资料，因此仅从二里头博物馆官网进行收集，资料具有很大的局限性，文物资料的补充收集以及结构化处理工作仍需后续学者进行。二是游客的问题复杂性。游客的思维具有极大的发散性，并不会囿于单一的博物馆之中，可能会联想到其他并没有收录在本数据集中的问题，这将使得对话系统对此难以回答。当然本项目在底层设计之中，有这样一条语句“如果问题超出你的数据范围，回答‘不知道’。”因此本项目系统不至于在历史这一重要领域，出现类似于ChatGPT对未知问题进行模糊或编造的弊端。但是未能回答游客的发散性问题，仍然会降低游客的观赏程度。这就需要博物馆将此系统作为一个不断更新的存在，不断收集用户在使用的过程中，有哪些问题是系统回答“不知道”的，将此问题整理、汇总并纳入至系统数据库之中，数据库的资料也将并不仅包含单一博物馆的数据，希冀未来可以建立全国范围内联通的对话系统数字博物馆，进而更好满足游客对历史文物的知识的渴求。

参考文献

[1] 姚菲.博物馆智慧化建设的实践与思考——以成都金沙遗址博物馆为例[J].东南文化,2023(02):165-173.

[2] 李祥,黄熠,李永昌.数字转型视阈下的博物馆展陈设计情境化困境与解决路径研究[J].家具与室内装饰,2022(12):77-81.

[3]顾振清,肖波,张小朋等.“探索思考展望：元宇宙与博物馆”学人笔谈[J].东南文化,2022(03):134-160.

[4]周鼎凯,张枫林,丁治国等.自然语言处理技术在博物馆领域的应用前景研究：以ChatGPT为例[J].科学教育与博物馆,2023,9(03):39-48.

[5]Wu, Tianyu et al. A Brief Overview Of ChatGPT: The History, Status Quo And Potential Future Development[J].Journal of Automatica Sinica 10 (2023): 1122-1136.

[6] Ji S , Pan S , Cambria E ,et al.A Survey on Knowledge Graphs: Representation, Acquisition and Applications[J]. 2020.DOI:10.1109/TNNLS.2021.3070843.

[7]刘峤,李杨,段宏等.知识图谱构建技术综述[J].计算机研究与发展,2016(03):582-600.