个人介绍
大语言模型与经济学研究 湖南大学

主讲教师:肖皓

教师团队:共3

  • 肖柏高
  • 孙天宇
  • 肖皓
大语言模型课程简介 本课程聚焦于当下人工智能领域的前沿技术 —— 大语言模型,旨在为学员打造从理论基础到实践应用的全方位学习体验,帮助学员深入理解并熟练掌握大语言模型的核心知识与技能。 课程内容丰富且系统,从大语言模型的发展脉络入手,详细剖析其背后的技术原理,涵盖从早期的统计语言模型到如今先进的大语言模型的演进历程,让学员清晰把握技术发展的趋势。深入讲解大语言模型的关键技术,如规模扩展、数据工程、高效预训练等,揭示模型强大能力的实现机制。同时,课程对模型训练的各个环节进行细致拆解,包括数据准备、模型架构设计、预训练任务选择、优化参数设置等,使学员具备独立进行模型训练和优化的能力。在微调与对齐、模型使用、评测与应用等方面,课程也提供了全面且深入的知识讲解和实践指导,让学员能够根据不同的场景需求,灵活运用大语言模型技术解决实际问题。 教学过程中,采用理论讲授、案例分析与实践操作相结合的方式。理论讲解注重深入浅出,将复杂的技术概念和原理以通俗易懂的方式呈现给学员;案例分析环节引入大量实际应用案例,从自然语言处理到信息检索,从医疗到教育等领域,帮助学员更好地理解大语言模型在不同场景下的应用逻辑和价值;实践操作环节安排丰富的实验和项目,让学员在实际操作中巩固所学知识,提升动手能力和解决实际问题的能力。 通过本课程的学习,学员将收获扎实的大语言模型理论知识,掌握模型训练、优化、应用和评估的核心技能,能够在相关领域的研究和开发工作中发挥重要作用。无论是希望深入探索人工智能技术的科研人员,还是渴望将大语言模型应用于实际业务的开发者,都能从本课程中获得宝贵的知识和经验,为在大语言模型领域的职业发展和技术创新奠定坚实的基础。
学校: 湖南大学
开课院系: 经济与贸易学院
课程编号: ET06084
学分: 0
课时: 0

基于大语言模型 API 的企业年报处理实验报告

一、实验背景

企业年报包含丰富的企业运营、财务、战略等信息,但传统的人工处理方式效率低、易出错。大语言模型在自然语言处理方面表现出色,本实验旨在探究如何调用大语言模型 API 高效处理企业年报,挖掘关键信息,为企业分析和决策提供支持。

二、实验目的

  1. 熟练掌握大语言模型 API 的调用方法,实现对企业年报文本的自动化处理。

  2. 利用大语言模型从企业年报中提取关键信息,如财务数据、业务描述、风险因素等,提升信息提取的准确性和效率。

  3. 通过实验对比不同大语言模型在企业年报处理任务中的性能差异,为实际应用选择合适的模型提供参考。

  4. 探索大语言模型在企业年报分析领域的应用潜力,为后续更深入的研究和实际业务应用奠定基础。

三、实验环境

  1. 硬件环境:普通办公电脑,具备基本的计算和网络连接能力。

  2. 软件环境:编程语言选用 Python,借助常用的开发库如requests实现 API 调用,pandas用于数据处理和存储,jupyter notebook作为开发和实验记录的平台。

四、实验方法

  1. 数据收集:从证券交易所官网或企业官方网站收集多份不同行业、不同规模企业的年报,涵盖制造业、服务业、科技企业等,确保数据的多样性和代表性。

  2. API 选择与调用:选取如 OpenAI 的 GPT 系列(如 GPT-4)、百度文心一言、阿里云通义千问等具有代表性的大语言模型 API。根据各 API 的文档要求,进行接口配置和调用。在调用时,针对企业年报处理任务,精心设计输入提示,明确要求模型提取的信息类型,如 “请提取该年报中的本年度营业收入、净利润、主要业务产品以及面临的主要风险因素”。

  3. 信息提取与处理:将企业年报文本按章节或段落进行拆分,逐段输入大语言模型进行信息提取。对模型返回的结果进行整理和清洗,去除重复、无效的信息。利用pandas库将提取的关键信息结构化存储,方便后续分析。

  4. 性能评估:建立多维度的评估指标体系,包括信息提取的准确率、召回率、F1 值。准确率衡量提取的信息中正确信息的比例;召回率反映实际存在的关键信息被成功提取的比例;F1 值综合考虑准确率和召回率,更全面地评估模型性能。通过人工标注的方式,为每份年报标注出准确的关键信息,作为评估的基准。对比不同大语言模型在各项指标上的表现,分析其性能差异。

五、实验步骤

  1. 数据预处理:对收集到的企业年报进行格式转换,统一为文本格式(.txt)。使用文本清洗工具去除年报中的图表、图片、特殊格式符号等干扰信息,只保留纯文本内容。

  2. API 调用与信息提取:根据选定的大语言模型 API,编写 Python 代码进行调用。将预处理后的年报文本按合理长度分段,依次发送给模型,并记录返回的信息提取结果。在调用过程中,根据模型的反馈和实际提取效果,不断优化输入提示,提高信息提取的质量。

  3. 结果整理与分析:将提取的信息整理成结构化的数据表格,对数据进行一致性检查和错误修正。依据人工标注的基准数据,计算各模型在信息提取任务中的准确率、召回率和 F1 值。采用数据可视化工具(如 matplotlib)绘制图表,直观展示不同模型的性能差异。

  4. 实验优化与验证:针对性能表现欠佳的模型,尝试调整输入提示的内容、结构和表达方式,再次进行信息提取和性能评估,观察模型性能是否有所提升。选取新的未参与实验的企业年报数据,对优化后的实验方案进行验证,确保实验结果的可靠性和泛化性。

六、实验结果与分析

  1. 信息提取结果:以表格形式呈现不同大语言模型从企业年报中提取的关键信息,如财务数据、业务描述、风险因素等。展示部分提取结果示例,对比不同模型的输出内容,分析其准确性和完整性。

  2. 性能评估结果:通过表格和柱状图展示各模型在准确率、召回率和 F1 值等指标上的具体数值。分析不同模型在各项指标上的优势和劣势,例如,GPT-4 在财务数据提取上准确率较高,但在风险因素分析的召回率方面可能不如文心一言。

  3. 影响因素分析:探讨输入提示的设计对模型性能的影响。例如,详细、明确的提示能够引导模型更准确地提取信息,但过于复杂的提示可能导致模型理解困难。分析企业年报内容的复杂性、专业性对模型性能的影响。对于专业性较强的科技企业年报,部分模型可能因知识储备不足而表现不佳。研究不同大语言模型的特点和适用场景,如通义千问在处理中文年报时可能在语言理解和表达上更具优势,而 GPT-4 在国际企业年报处理中可能因多语言能力和广泛的知识覆盖表现出色。

七、实验结论与展望

  1. 结论:总结不同大语言模型在企业年报处理任务中的表现,明确哪种模型在信息提取的准确性、效率等方面更具优势。归纳实验过程中发现的问题和解决方案,如如何优化输入提示、处理复杂年报内容等。强调大语言模型在企业年报处理领域的应用潜力,但也指出目前存在的局限性,如对专业术语的理解不够精准、部分信息提取存在遗漏等。

  2. 展望:提出未来研究方向,如探索将大语言模型与知识图谱技术相结合,增强模型对企业年报中复杂关系和专业知识的理解和处理能力。建议进一步优化输入提示的设计方法,通过自动化或半自动化的方式生成更有效的提示,提高信息提取的效果。探讨多模型融合的可能性,综合不同大语言模型的优势,提升企业年报处理的整体性能。

肖柏高

职称:教师

孙天宇

职称:教师

肖皓

职称:教师

单位:湖南大学

部门:非洲研究院

提示框
取消 进入课程
提示框
确定要报名此课程吗?
确定取消

京ICP备10040544号-2

京公网安备 11010802021885号