技术应用 | 浅析大模型在投行业务领域的主要应用方向——以华泰联合证券的实践为例

Connor 欧意交易所官网 2025-10-16 5 0

文/华泰联合证券有限责任公司质量控制部总经理 杨蓉

华泰联合证券有限责任公司质量控制部 张桐源 郗瑾 何广瑞 李广宇 韩利娜 钟赞

证券公司在投行业务领域不断加大信息技术投入,已逐步实现了业务的线上化、平台化,部分投行已经开始向全面智能化转型。然而在转型过程中,尚存在诸多瓶颈,包括因投行文本的复杂性导致的智能化水平较低,以及项目执行领域智能化水平较高,但商机洞察、价值判断、精细管理等方面因技术实现难度大带来的转型发展不平衡问题。近年来蓬勃发展的大语言模型技术为解决上述问题提供了抓手,本文意在针对投行业务智能化转型中存在的痛点问题,提出大语言模型在投行业务的主要应用方向,并结合华泰联合证券的实践予以阐释,期望探索一条可行的投行业务数智化转型之路。

投行业务科技发展仍有较大提升空间

证券公司投资银行业务执行过程中需要输出大量文本内容,由于以信息披露文件和工作底稿为典型代表的投行文本具有高度个性化特征,近年来投行业务的智能化主要围绕文本处理这一核心能力展开,在有效的投行文本结构化基础上,实现相关辅助尽职调查及辅助质量把控。然而在这一领域,面对更复杂的投行文本内容,各类现有智能系统则会“捉襟见肘”,难以进行实质性的处理和分析,相关工作仍较为依赖业务人员的经验。

在项目执行领域以外,投行业务的智能化水平仍明显不足,例如注册制改革对投行机构的价值发现能力提出了更高要求,然而在项目价值判断、分析定价等方面仍严重依赖业务人员的个人判断,在商机洞察与展业获客上也普遍未进入智能化环节。同时,目前智能应用更多关注项目执行环节的赋能,但在更为早期的项目质量判断环节较为缺失,而项目自身质地实质上才是项目质量的基础。

目前,造成投行业务上述环节智能化水平明显不足的原因主要是技术能力的限制,相较于项目执行领域具有较多标准规则形成“硬要求”,其他环节更加注重于“软实力”,无法形成明确的业务规则或执行范式。因此,智能应用的构建缺乏标准知识体系的支撑。

大语言模型赋能投行业务发展的主要方向

近年来,大语言模型技术为证券公司投行业务在金融科技领域的探索提供了更多可能性。基于投行业务智能化转型中的痛点问题,我们对大语言模型赋能投行业务的主要发展思路如图1所示。

技术应用 | 浅析大模型在投行业务领域的主要应用方向——以华泰联合证券的实践为例

图1 大语言模型赋能投行业务发展方向

1. 以文本处理能力作为智能化水平提升的底层基础。目前,证券公司智能应用上的文本处理都是通过小模型方案(即对某一类型文本标注训练)实现的,主要方式为针对数据的逐个拆解,穷举单条规则与文本之间的关系并标注,转换为多个语义理解节点,通过与文本的多次语义理解的相似度返回结果,需要大量的文本训练和人工标注。这类方案在实际场景中只能解决一些相对简单且标准化的需求,而针对复杂场景,如招股说明书中的长文本、前后勾稽,工作底稿版式多样且较为杂乱等,传统小模型方案则十分受限,因为无法穷尽标注样例,在个性化程度高的文本场景里难以取得良好效果,这导致目前投行业务智能应用向更深层次更广领域拓展存有较大阻碍。

展开全文

而大语言模型的泛化能力、语义理解能力为上述问题提供了解决思路,可以在文本处理上,对传统小模型方案形成有益的补充,解决传统方案的高成本和长周期问题。“大模型+小模型”的文本处理模式,既能保证智能应用适配于投行业务文本特点的专精能力,又可以带动智能应用向更深层次的业务场景、更复杂的业务规则迈进,从而为投行业务智能化转型提供坚实的能力底座。

2. 以信息研究赋能投行客户质量及价值判断体系。投行项目的质量控制工作,主要由项目质量和执行质量两部分构成。在注册制前,投行业务更加注重“可批性”,即通过规范整改使企业能够通过证券发行监管审核,执行质量的重要性高于项目质量。随着全面注册制改革的不断推进,投行项目的重点从“可批性”向“可投性”转变,项目质地是否值得推介给资本市场成为首要原则,因此,项目质量及价值判断的重要性愈发凸显。以股权IPO业务为例,2023年7月沪深交易所发布的《以上市公司质量为导向的保荐机构执业质量评价实施办法(试行)》中,上市公司质量评价占保荐机构执业质量评价体系的权重达到70%,其中较多涉及盈利能力、成长能力等价值判断的指标。可见,项目的价值判断在投行客户开发和内部资源优化配置环节的重要性显著提升。

借助大语言模型技术,投行可以结合自身业务特点及目标客户群体特征,构建适用于不同业务品种的客户质量评价体系,通过对评价体系不同维度变量和权重的设置,智能分析判断并输出评价结果和风险事项,从而辅助挖掘优质客户资源、提升项目承做价值,实现以客户质量与执行质量并重的全链条项目质量管理机制。

3. 以知识管理产品增强投行业务经验传导机制。由于投行服务的客户广泛,不同行业的客户存在不同的特性,不同的企业又有诸多个性化问题,导致如何有效执行项目较为依赖业务人员的经验。但业务经验传递时间长、成本高,往往需要完整项目历练。同时,业务人员的经验是差异化的,所传递的经验很多是零散的、个性的、不完整的。因此,业务经验不足往往会导致项目执行质量较低,业务经验差异化会导致公司项目执行质量参差不齐。在此背景下,高效的业务经验传导机制就显得尤为重要。

在知识传导上,投行目前普遍采用内部培训、完善知识库建设等方式,效率相对较低。在此背景下可考虑运用大语言模型技术对业务经验传导过程进行赋能。例如,较多金融企业推出了AI智能问答助手或AI客服,能够对员工和客户的问题进行解答,同理可以将金融行业大语言模型连结内外部知识库,业务人员要求大语言模型基于指定的知识范围进行内部规则的回答、外部法规和案例的检索,大语言模型可对相关知识进行总结提炼,从而提升知识传导效率,让业务执行有据可依,拉升投行项目执行质量。

4. 以大文档生成辅助投行项目尽职调查。尽职调查工作是投资银行业务最重要的环节之一。目前,行业内已经尝试引入科技手段执行尽职调查过程中部分重复性高、人工效率较低的工作,但基于技术的局限性和使用效果问题,目前更多是作为辅助手段协助项目组进行核查。实际上,投行项目的尽职调查,在工作形式上可以反映为依据各类工作底稿和内外部信息,生成相关文档并载明核查依据、核查结论的工作过程,尽职调查相关的智能类应用即是对这一过程进行赋能。例如,业内普遍采用的银行流水智能核查,是将纸质流水底稿转化为电子化数据,并对电子化数据进行一定程度上的摘录分析,输出需要用户关注的异常流水。

上述银行流水核查产品从文件识别到异常流水生成,是一个传统的文本标注训练的运用过程,需要人工对每个细分场景进行逐一开发。而大语言模型基于其强大的语义理解、丰富的知识储备及快速的信息搜集归纳能力,在资源整合及文档智能生成上具有先天优势,可以从公开信息中的海量金融数据、行业研究、新闻报道,以及定向提供的底稿文件等多渠道收集信息,通过筛选、整合和分析,自动生成尽职调查过程中各类核查文档及核查结论,尤其在行业发展情况、政策分析、公司基本情况等方面具有极高的可实现性。大语言模型还可以基于审计报告和其他财务、业务相关底稿文件智能生成基础的财务分析内容,从而降低人工尽调负担,提升项目执行效率。

5. 以规则审核平台提升投行业务质量控制能力。由于证券发行监管规则体系十分庞大,且为灵活应对多变的一二级市场环境,政策调整频率相对较高,同一类型业务不同板块又有不同程度的细化要求,这导致规则审核类应用也需要快速的动态调整,不断适配新规则进行标注训练。规则的频繁调整更新不仅耗费成本较高,也对系统建设的体制机制提出非常高的要求,无论是数字化建设相关的业务团队还是IT团队,都无法保障能够完全准确及时地依据规则来升级智能审核应用。

随着技术发展,以大语言模型来理解监管规则,并智能化审核具有可实现性。具体来说,可考虑构建依托于大语言模型能力的智能审核平台,对业务规则进行智能拆解,形成细分规则的提示词工程,进而用相关提示词工程对规则对应的文件进行智能审核,依靠大语言模型召回结果并总结审核结论。相较于业务和技术人员更新升级业务规则及重新标注训练,大语言模型智能审核平台可以显著提高升级迭代效率,适配证券发行监管领域法规的灵活性特征,降低人工维护成本。在此过程中,业务人员作为平台使用者也可以成为平台开发者,参与规则拆解及大语言模型提示词工程调试,从而群策群力实现去中心化的业务规则审核运维。

6. 以大语言模型数据治理驱动投行业务精细化管理水平提升。投行业务项目数量多、种类多,业务人员多且分散在全国各地,人员流动性也较大。因此,实现精细化管理一直较为困难,业务团队的管理往往通过部门对团队负责人的管理来实现,相关的业务管理数据,也较为依赖人工作业,行业内机构的业务管理背后缺少真实完整的数据支撑,这不利于管理水平及战略决策精准度的提升。

目前,行业内机构普遍实现了投行业务的线上化、平台化,逐步积累了较多项目数据、人员数据,需要重视数据资产的管理与运用,而大语言模型是海量数据治理的重要手段之一。可以考虑以业务人员和项目的执行数据、财务数据、周报数据为基础,综合文本挖掘、情感分析、标签归类、语义理解、逻辑推理、数据分析及可视化等技术,形成智能化的项目画像与人员画像,从而全方位驱动投行业务管理精细化转型。

大语言模型在华泰联合证券业务规则审核与知识管理上的实践情况

1. 在规则审核上的实践情况。华泰联合证券基于大语言模型建设的投行业务规则审核平台,实现了智能审核类应用的体系化扩展。该平台使用大语言模型技术实现文档处理、业务规则智能拆解和智能审核的应用。基于审核规则提示词工程,精准智能拆解规则,打造规则标准库并输出可视化、结构化审核结论,同时也支持业务人员基于大语言模型审核效果参与提示词工程的修改完善。

该智能应用以大语言模型能力为牵引,实现了对更广泛业务规则的审核智能化,同时具有极高的开放性,既可以满足项目执行质量管理要求,又具有业务人员灵活配置使用的工具属性,是投行业务智能审核领域的创新突破,具体解决方案如图2所示。

技术应用 | 浅析大模型在投行业务领域的主要应用方向——以华泰联合证券的实践为例

图2 投行业务智能审核平台解决方案

2. 在知识管理上的实践情况。2024年,华泰联合证券建设完成“投识问路”大语言模型智能问答产品,实现了证券发行监管领域全量法规、IPO业务全量监管问询案例回复数据标签化,并在此基础上支持业务人员选择知识库范围,设定拟检索的法规和案例库,对提问进行智能回答,包括查找法规、基于法规给出答案、查找市场审核案例,并实现与内部知识库对接,为内部知识的高效检索、传递、归纳提供帮助。同时,为了有效应对大语言模型幻觉问题,对于大语言模型智能生成的答案所涉及的法规和案例,均支持用户快速回溯定位原文,系统也会对大语言模型的回复进行二次校验,涉及引用非法规库中的法规进行总结回复的,会提示用户关注法规真实性。相关标签化的法规案例库已对接外部专业数据库,每日均会进行一次数据更新以保证及时性与准确性。

综上所述,大语言模型在投行业务领域预计具有较为广泛的应用,以大语言模型文本处理作为智能化水平提升的能力基础,进而分类发展大语言模型规则审核、大语言模型知识管理、大语言模型文档生成、大语言模型信息研究以及大语言模型数据治理,是本文基于当前投行业务智能化转型痛点提出的总体框架和重点方向。最后,需要关注的是,行业机构在进行大语言模型相关智能应用建设过程中,还应合理防范操作风险、合规风险,例如大语言模型存在的幻觉问题,目前尚无法完全避免,这是大语言模型技术的“达摩克利斯之剑”,通常严格指定内容生成的来源并合理设定提示词工程可以大幅降低幻觉产生的概率,同时也应该建立二次校验机制以防范上述风险。

(此文刊发于《金融电子化》2025年4月下半月刊)

评论