首页 >要闻 > > 正文

金融行业走入大模型时代,AI如何重塑产业生态?

投资者网 2023-08-25 21:41:11

《投资者网》侯书青


(相关资料图)

2023年8月23日, “北大光华-度小满金融大模型技术与应用论坛”(下称论坛)在北京举办,清华大学人工智能研究院常务副院长孙茂松,北京大学光华管理学院商务统计与经济计量系教授王汉生,光大信托数据中心总经理祝世虎,度小满CTO许冬亮,度小满数据智能部总经理杨青等嘉宾出席了本次研讨会。

(度小满CTO许冬亮)

通用大模型从问世至今接近一年,围绕在身上的光环也逐渐褪去,人们对它的认知也逐渐趋于理性:强如通用大模型,也有力所不及之处。行业想要依靠大模型产生新变革,首先要解决通用大模型在行业内的落地应用——开发行业大模型,成为AI技术实用化落地的新风向标。

2023年5月,度小满率先发布国内首个金融开源大模型“轩辕”,国内金融行业自此走入大模型时代。大模型如何重塑产业生态,金融大模型如何落地应用等话题成为产学研界的共同关注。

行业需要金融大模型

AI技术经过数十年的发展,逐渐从概念性较强、主要为C端提供新鲜感的“玩物”,转变为在B端、C端都能找到应用场景的工具。其中的商业潜力,在ChatGPT正式发布后显现出来:不计其数的资金入局,众多有技术实力的大企业不甘人后,争相披露自家在大模型领域的技术潜力。

这背后,是市场对AI时代的憧憬。当科幻照进现实,概念变为初具规模的工具后,现有通用大模型的能力,能否满足各行各业对它的期许呢?

腾讯高级执行副总裁汤道生曾表示:“通用大模型可以在100个场景中解决七八成问题,但未必能100%满足企业某个场景的需求”在专业问题方面通用大模型有自身的局限性。”在2023年全球数字经济大会上,度小满CTO许冬亮称:“比起通用大模型能力而言,金融行业非常需要垂直行业大模型。”

许冬亮在论坛上表示:“大模型让机器具有了常识,懂得了逻辑,学会了创作,让人和机器能以更自然的方式互动,通过与周边工具的结合,大模型已经具有了通用人工智能的雏形。金融行业是高价值行业,数字化基础好,高度依赖数据和技术,是大模型落地应用的高潜场景。对于中小金融机构,在大模型的浪潮里,他们也有机会通过应用创新,来加快自身的数字化和智能化进程,跨越数字化鸿沟。”

专业性更强,更细分的应用场景,需要让大模型拥有自己的“社会分工”,用垂直的能力适配垂直的市场需求。而金融行业寻求自己的垂直大模型,是该行业对专业度的需求使然,更是因为,金融行业的头部企业有足够的基础条件。

大模型所需的三大支柱:算法、算力、数据。其中数据决定了大模型的智能范围,而金融行业有许多公司在多年经营中掌握了海量的历史数据和文字资料等,为行业大模型的开发提供了天然的便利。且训练垂直大模型所需的数据量远小于通用大模型,在成本方面更具优势

而诸如度小满等互联网金融、金融科技企业,经过了多年经营,在算法、算力方面都形成了自己的解决方案。此外,当金融企业使用通用大模型解决专业性问题时,如果大模型并非本地部署,需要上传数据到对方服务器。这一过程存在数据泄露的风险,这对金融行业而言尤为致命。

2023年上半年,已经有企业率先发布了自己的金融大模型。

2023年3月,全球领先的商业、金融信息和财经资讯提供商彭博(Bloomberg)发布了BloombergGPT,该模型构建了3630亿个数据集,训练数据总量约为5300亿词,其中金融行业数据占比约为54.2%,但出于数据安全考量,该模型尚未以任何形式对外开放。

就在彭博发布BloombergGPT仅2个月后,国内领先的金融科技公司度小满发布了国内首个开源金融行业垂直大模型“轩辕”。度小满方面称,“轩辕”在金融名词理解、市场评论、数据分析、新闻理解等方面具有明显优势,在任务测试中相较于基座模型效果提升了70%。

度小满CTO许冬亮表示,目前“轩辕”已经面向上百家金融机构开放试用。

除了度小满的“轩辕”外,星环科技也发布了面向金融量化领域的生成式大语言模型“无涯Infinity”,恒生电子也预计在9月开放自研金融大模型LightGPT的试用接口。

行业大模型有何优势?

OpenAI发布的ChatGPT,率先在全球范围内掀起了AI热潮,以及GPT-4的问世,都彰显着它在通用大模型领域的前沿性。而彭博作为国外老牌咨询提供商,训练BloombergGPT的大部分数据来自彭博数据分析师们持续收集、维护了40年的金融语言文件,能够先一步发布金融大模型也是其实力与积淀的表现。

那么国产行业大模型与上述二者相比,是否存在优势?

首先,与主流开源大模型之间的对比,度小满发布的“轩辕”已经在金融相关的专业性问题上展现出了较为明显的优势。

公开资料显示,“轩辕”在金融任务评测中,全面超越了目前主流的通用大模型。在150次回答中赢得了63.33%的胜率。而在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT3.5,另有61.22%的任务表现与之持平,题目涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。

金融任务的评测成绩意味着,比起目前的主流通用大模型,“轩辕”对于金融相关领域问题的回答会更具专业性;而通用能力评测中有超过71.42%的任务表现与主流通用大模型持平甚至超越,则表明“轩辕”在面对金融领域之外的普通问题时,表现与通用大模型较为接近,“轩辕”也能够实现大部分通用大模型的功能。

从参数的丰富度上看,“轩辕”基于1760亿参数的Bloom训练而来,较彭博发布的大模型参数更丰富。此外,度小满还将自身在实际业务中积累的、规模在千亿级别的tokens的中文预训练数据集加入到“轩辕”大模型的研发中。

为此,《投资者网》根据伙乘平台对“轩辕”大模型的提问结果,就同样的问题向Bing AI提问,以简单测试“轩辕”大模型与主流通用大模型之间的差异。

结果表明对于类似“如果一家公司总资产为500亿美元,总负债为300亿美元,股东权益是多少?”这类涉及简单计算与概念解释的问题,二者均给出了正确答案与计算步骤。差异在于,“轩辕”大模型的回答中,还额外解释了“净资产不等同于股东权益”的概念。

(前者为Bing AI的回答,后者为“轩辕”的回答 《投资者网》研究员收集整理)

而对于“你能解释一下什么是抵押贷款和信用贷款的区别吗?”这一问题,Bing AI和“轩辕”给出的答案内容基本一致,区别在于前者的答案概括性比较强且比较零散,后者的答案条理较为清晰,便于提问者快速找出自己需要的部分。

经过一系列问题的对比,能够明显发现,在通常的名词解释类问题中,二者的表现不相上下。而在回答比较专业的金融类问题时,“轩辕”的回答不仅能够让使用者了解答案本身,还能够根据问题引申出一些容易混淆的概念并给出具体的解释。

在2023年全球数字经济大会人工智能高峰论坛上,“度小满轩辕大模型在金融领域的应用”入选“北京市人工智能行业(大模型类)赋能典型案例(2023)”。

在“轩辕”发布的一个月后,恒生电子也发布了自研的金融大模型LightGPT,国产行业大模型再传佳讯。恒生电子首席科学家白硕介绍称,LightGPT使用了超过4000亿tokens的金融领域数据,辅以超过400亿tokens的语种强化数据,能够满足各类金融企业的业务需求。

与海外企业发布的金融大模型相比,国内企业发布的大模型在训练阶段采用的数据会更贴合国内金融实践,得出的结论也更适合国内金融行业发展的实际情况。与BloombergGPT尚未开放不同,目前“轩辕”已经可以在Huggingface中申请下载,面向上百家金融机构开放试用;恒生电子发布的LightGPT也将于9月份开放试用接口。

国产行业大模型的逐渐铺开,会为国内金融行业带来怎样的改变?是一个值得行业关注的重要趋势。

大模型时代的前夜

眼下,国内金融行业已经来到大模型时代的前夜,天边已经泛起一抹鱼肚白,而当这一缕名为“大模型”的曙光真正照进行业时,我们眼前看到的,将会怎样的一番天地呢?

首先,大模型将极大提升金融机构收集、整理信息的能力。

还是以度小满为例,最新数据显示,度小满已经累计为超过1800万小微企业主和个体工商户授信。整个2022年,度小满为小微企业发放信用贷款超过5200亿元。在长期的业务实践中,度小满在大数据技术的支持下已经建立了较为完善的征信中台。

小微企业常常会因为规模小、质押物不足等问题,在面临资金短缺时找不到合适的融资渠道。而传统的征信报告解读方式,也存在误判企业成色的可能:征信报告干净的客户,或许与黑产有关,部分优质客户,有时也会因为近期资金紧张而无法通过征信评估。

而大数据,作为大模型的前置科技,其海量的专业数据能够保障大模型的专业性、精确度。如今,度小满的征信中台能够结合大语言模型,将征信报告解读出40多万个与风险相关的指标,把银行风控模型的风险区分度提升了26%。

与传统评估方式涉及的几百个指标相比,度小满在大模型的支持下,能够更全面地评估贷款人的基本情况,在降低信贷风险的同时,切实解决优质小微企业融资难的问题。

度小满表示,经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且显著提升了模型在金融垂直领域的性能。轩辕大模型的数据集覆盖了金融研报、股票、基金、银行、保险大多数金融领域中常见的应用场景。

恒生电子发布的LightGPT的功能与“轩辕”相近,能够为投顾、客服、投研、运营、风控、合规、研发等金融业务场景提供底层 AI 能力支持。

随着大模型技术在金融行业各领域的参与度逐渐加深,金融机构的业务也将会朝着更加科学、高效的方向发展。大模型时代的金融业,值得每一个人期待。(思维财经出品)■

上一篇:网络问政·办实事 | 留言后 围挡已经加固 下一篇:最后一页
x
推荐阅读

金融行业走入大模型时代,AI如何重塑产业生态?

2023-08-25

网络问政·办实事 | 留言后 围挡已经加固

2023-08-25

南向资金今日净买入近34亿港元 美团获净买入居前

2023-08-25

乾景园林:中标9438.67万元海淀区工程项目

2023-08-25

紧急通知:湖南!江西!大到暴雨来袭!后天开始

2023-08-25

理想汽车:到年底将在全国高速公路建成300座超级充电站

2023-08-25

欧美冬季订单大量涌入越南,中资企业验厂忙

2023-08-25

“这应该是一个温和的警示”

2023-08-25

始得西山宴游记表达了作者什么感情 始得西山宴游记抒发了怎样的人生感受

2023-08-25

挪威国家石油公司Equinor启动挪威大型浮式风电场

2023-08-25

指甲生长的过程和形状(指甲的生长过程图解)

2023-08-25

色度坐标(关于色度坐标的基本详情介绍)

2023-08-25

众人期待的画面终于出现了!张艺兴分享会现场与粉丝共舞

2023-08-24

韩媒:韩国多个海鲜市场几乎空无一人,渔民担忧未来生计

2023-08-24

西安又一条网红街!皇城里•民乐园步行街:10月1日亮相!

2023-08-24

阿根廷、埃及、埃塞俄比亚、伊朗、沙特阿拉伯、阿联酋获邀加入金砖国家合作机制

2023-08-24

小米云相册在哪查看_小米云相册在哪

2023-08-24

中国银河:给予金山办公买入评级

2023-08-24

AI龙头第二财季业绩超预期 英伟达的A股“朋友圈”能否接力?

2023-08-24

日本核污染水排海引发美国专家担忧:有害放射性元素或穿越整个太平洋

2023-08-24

影视股集体走高,幸福蓝海、金逸影视涨停,暑期档票房持续破纪录

2023-08-24

三家“平安”互撕,大量细节曝光

2023-08-24

晚点2个半小时后,中国男篮昨天抵达马尼拉

2023-08-24

《深圳市化工园区建设标准和认定管理实施办法》实施 助推高端电子材料企业落地

2023-08-24

奎文经济开发区创新“四到位”模式 擦亮志愿服务品牌

2023-08-24

夜读丨孩子,才是最应被包容的那个

2023-08-23

昔日“川股王”康华生物上半年业绩下降两成,多位核心高管离职|看财报

2023-08-23

大盘再度杀跌探底 短期趋势不理想

2023-08-23

4名缅甸妙瓦底电诈犯罪嫌疑人被押解回国

2023-08-23

注意!迈赫股份将于9月12日召开股东大会

2023-08-23

恒尚节能涨停,2023年上半年净利润同比增长44.57%

2023-08-23

七夕节扬子晚报·家有喜事项目交流会——“新人”更重视仪式感,上扬子晚报“官宣”结婚公告浪漫又庄重

2023-08-23

沃尔沃汽车将迎人事调整:潘鹤松将重返中国

2023-08-23

2023金银湖二小(马池小学)转学须知及流程

2023-08-23

复兴号车头上有雨刷器吗?网友:地表最强小飞棍!

2023-08-10

暑期演出市场票房23.27亿元,北京居全国榜首

2023-08-10

助力长三角打造数智化多业态智慧园区 华建集团环境院无锡映月湖科技园一期室外照明设计

2023-08-10

微软推Microsoft Whiteboard新工具栏 添加生产力

2023-08-10

ISC 2023发布360安全云 周鸿祎:下产业数字化蓝海,安全未来是服务业

2023-08-10

宁波道可得企业管理咨询有限公司(关于宁波道可得企业管理咨询有限公司简述)

2023-08-10

中国建筑50亿中票将到期兑付 票面利率为4.70%

2023-08-10

英伟达发布AI芯片GH200 黄仁勋称“它会疯狂推理”

2023-08-10

广德市围绕“三点”开展农村人居环境整治

2023-08-10

三位滚轮密码锁的构造_三位滚轮密码锁内部图

2023-08-10

“村超”“村BA”火爆出圈的密码

2023-08-10

纪录片《雪豹和她的朋友们》:走进神秘的“雪山之王”

2023-08-10

海南多部门开展“个体工商户服务月”活动

2023-08-10

县城整治医药腐败 数百人主动退赃 基本情况讲解

2023-08-10

迪士尼第三财季营收 223.3 亿美元,Disney + 订阅用户数低于预期

2023-08-10

打新一签能赚近10万!上市首日暴涨3699.81%的盟固利是何来历?|产业最前线

2023-08-10

微信怎么炸屎(微信炸屎特效上线)

2023-08-10

ps怎么加点减点(ps怎么加点)

2023-08-10

这一国政府宣布,限制进口!苹果、三星等巨头已做出反应→

2023-08-09

《无主之地3》销量破1800万份 系列总销量达8100万

2023-08-09

法国一度假屋发生火灾已致9人死亡 马克龙致哀

2023-08-09

富泉樱花苑_关于富泉樱花苑介绍

2023-08-09

俄罗斯莫斯科州一工厂爆炸致38人受伤

2023-08-09

清镇:“三实现”助推“会展一次办”业务上线

2023-08-09

自考换专业公共课需要重新考吗?

2023-08-09

王濛被带走调查?好友:流言不靠谱 基本情况讲解

2023-08-09

冠军教练带你练,小朋友们体验了一堂别开生面的体育课

2023-08-09

《逆水寒手游》洪钟遗音怎么做 小吉奇遇洪钟遗音任务攻略

2023-08-09

475个村农作物旱情严重 湖南祁阳打“组合拳”抗旱保收

2023-08-09

永安林业:接受国寿资产、中邮人寿等机构调研

2023-08-09

联合光电(300691.SZ):所掌握的黑光全彩技术为全球首创领先技术

2023-08-09

截至6月末公募基金资产净值为27.69万亿元

2023-08-09

万亿生鲜电商市场,九死一生

2023-08-09

门头沟接报损车辆4328辆,已定损及赔付1188辆3262万元

2023-08-09

127球追平艾克森!武磊并列中超历史射手王

2023-08-09

大华股份广东新设子公司 业务含物联网技术服务

2023-08-09

民企能不能走出困境,将定义未来经济的繁荣

2023-08-09

广汽丰田凯美瑞,一箱油续航达1000公里,今年6个月销量超10万台

2023-08-09

秋天第一发火箭!长二丙火箭成功发射环境减灾二号06卫星

2023-08-09

2023年6月中国与厄瓜多尔双边贸易额与贸易差额统计

2023-08-09

大S汪小菲官司开打 大S未出庭超10月未公开露面

2023-08-09

韦德反讽皮尔斯:房租很贵 但我免费住在他心里 让他继续惦记我吧

2023-08-09

实践取向小学教师教育教程:语文教学基础(关于实践取向小学教师教育教程:语文教学基础介绍)

2023-08-09

提前防范!卡努影响区与黑吉两省受灾区域高度重叠

2023-08-09

扬中乡土菜煎大粉

2023-08-09

努组词有什么(努组词有哪些)

2023-08-09

加量不加价!瑞虎8 PRO冠军版正式上市,售12.69万元起

2023-08-09

两千余年前的汉代说唱俑 为何出现在成都大运会闭幕式的舞台?

2023-08-08

海天瑞声:正在加快布局大模型相关的数据服务能力体系建设

2023-08-08

喜羊羊与灰太狼之开心闯龙年档案(羊羊与灰太狼之开心闯龙年)

2023-08-08

怎样保持心理健康?一起来关注《心理健康素养十条》(第一、二条)

2023-08-08

纪念北京奥运会成功举办15周年 “追梦十五年”主题展览在鸟巢开幕

2023-08-08

蔡戈鸣:代建能带来成本的直接降低 | 博鳌快讯

2023-08-08

清城区龙塘镇举办反诈精准劝阻工作培训会 全力守护群众财产安全

2023-08-08

准格尔旗:争做黄河“卫士”助推生态保护

2023-08-08

中年女人的贵妇感,穿搭4特征

2023-08-08

不畏上半年利润腰斩 嘉能可(GLNCY.US)仍寻求收购泰克资源(TECK.US)

2023-08-08

四昼夜抢通24处险情地段 滨绥铁路全线恢复通车

2023-08-08

8月8日中化岩土涨停分析:雄安新区,大基建,京津冀概念热股

2023-08-08

中国男篮首秀惊艳,李凯尔17次失误,主帅不满被驱逐!

2023-08-08

再获数亿元融资,T3出行吸引大佬的魅力源自何处

2023-08-08

软银第一季度净亏损4776.2亿日元

2023-08-08

六桂福珠宝店怎么样 六桂福珠宝怎么样

2023-08-08

通川区:小李子成就大产业

2023-08-08

电影奖项含金量排名_电影奖项

2023-08-08

山东济南将建成2000张家庭养老床位

2023-08-08