事件
彭博社构建迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型——BloombergGPT。该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。该模型在金融任务上的表现远超过现有模型,且在通用场景上的表现与现有模型也能一较高下。
从测试来看BloombergGPT在以下五项任务中的四项( ConvFinQA,FiQA SA,FPB和Headline)表现最佳;而对于测试一ConvFinQA来说,这个差距尤为显著,因为它需要使用对话式输入来对表格进行推理并生成答案,具有一定挑战性。
(1)测试一:ConvFinQA数据集是一个针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。
(2)测试二:FiQA SA,第二个情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。
(3)测试三:标题,数据集包括关于黄金商品领域的英文新闻标题,任务是判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。
(4)测试四:FPB,金融短语库数据集包括来自金融新闻的句子情绪分类任务。
(5)测试五:NER,命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。
投资建议 :
本次彭博社发布为金融界打造的大型语言模型在部分金融垂直场景表现出强于通用大模型的能力,我们认为金融领域的GPT革命或刚刚开始,因此我们继续关注。
建议关注GPT行业应用相关标的:
金融:同花顺、恒生电子、东方财富(海外&传媒组覆盖)、长亮科技、顶点软件等。
教育:科大讯飞、视源股份(与电子组联合覆盖)、鸿合科技(轻纺组覆盖)、捷安高科。
风险提示:
AI应用落地不及预期、技术发展不及预期、国内大模型进展不及预期。
01
彭博社发布BloombergGPT,在多项任务中表现优异
3月30日,根据彭博社发布的研究报告显示,其构建了迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型——BloombergGPT。该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务,在执行金融任务上的表现远超过现有模型,在通用场景上的表现与现有模型也能一较高下。
通用NLP模型处理金融领域任务时会面临不少挑战,首先就是无法理解财经新闻背后的市场“情绪”:以情感分析为例,一个题为“某公司将裁员1万人”,在一般意义上表达了负面情绪,但从金融市场情绪来看,它有时可能被认为是积极的,因为这一做法可能提振投资者信心,使公司的股价上涨。
从测试来看,BloombergGPT在五项任务中有四项(ConvFinQA,FiQA SA,FPB和Headline)表现最佳,NER(Named Entity Recognition)排名第二,对于ConvFinQA来说,这个差距尤为显著,因为它需要使用对话式输入来对表格进行推理并生成答案,具有一定挑战性。
(1)测试一:ConvFinQA数据集是一个针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。
(2)测试二:FiQA SA,第二个情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。
(3)测试三:FPB,金融短语库数据集包括来自金融新闻的句子情绪分类任务。
(4)测试四:标题,数据集包括关于黄金商品领域的英文新闻标题,来判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。
(5)测试五:NER,命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。
02
国内金融GPT企业具备大模型技术,金融大模型落地值得期待
国内金融GPT相关企业在数据上有着大量的积累,部分企业已经在金融大模型上有所布局,我们认为,金融大模型的核心在于数据,国内金融GPT企业未来有望自研金融大模型。
以同花顺为例,随着大模型技术的快速发展,同花顺在逐步尝试将大模型在业务中落地,目前大模型在自然语言处理相关的业务里都取得了比传统模型更优的效果。同花顺在问答、对话、信息抽取、舆情监控等领域都有所布局。
(1)问答业务:同花顺的问答业务主要是“同花顺问财”,主要场景在同花顺APP语音助手、问财APP端、问财Web端等。业务形式是将用户输入的问句解析为 condition (比如股票标的、指标、时间),然后从同花顺的后台海量的金融数据中取数并生成回答、表格等。
(2)对话系统:对话系统主要涉及多引擎的对话分发、跨引擎的多轮对话异常流程调度等对话管理技术,行业内一般做单一的任务型对话或者开放型对话,但同花顺的业务场景往往要求先做意图识别和分发,再同时支持任务型和开发型的对话。目前同花顺业务中的对话机器人分为云端版和企业版,分别满足 C 端和 B 端的客户需求。C 端主要是智能投顾的业务中的“问财助手”,B 端主要是来电助理、数字人客服、智能外呼机器人等产品。
03
建议关注
本次彭博社发布为金融界打造的大型语言模型在部分金融垂直场景表现出强于通用大模型的能力,我们认为金融领域的GPT革命或刚刚开始,因此我们继续关注金融GPT相关标的:
金融:同花顺、恒生电子、东方财富(海外&传媒组覆盖)、长亮科技、顶点软件等。
教育:科大讯飞、视源股份(与电子组联合覆盖)、鸿合科技(轻纺组覆盖)、捷安高科。
04
风险提示
1)AI应用落地不及预期:若AI相关应用的落地不及预期,相关公司或将受到影响;
2)技术发展不及预期:目前AI技术发展迅速,相关模型短时间内多次迭代,如相关技术发展速度无法匹配AI发展,相关公司或将受到影响;
3)国内大模型进展不及预期:GPT系受到国内外广泛关注,国内加速国产大模型研发,若后续研发进展及应用不及预期,相关公司或将受到影响。#AI应用场景迎来大爆发#
来源:天风证券