2023年银行业:ChatGPT如何改变银行业.pdf
《2023年银行业:ChatGPT如何改变银行业.pdf》由会员分享,可在线阅读,更多相关《2023年银行业:ChatGPT如何改变银行业.pdf(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、ChatG PT如何改变银行业?2023年3月摘要1、什么是ChatGPT?ChatGPT是什么?是将神经网络算法中的Transformer模型从理论变为现实的划时代应用。ChatGPT强在哪?算力强数据多。近4年,GPT历代模型的开发和训练得到了微软在资金(110亿美元)和 算 力(打造世界第五超级计算机)上的强力支持,目前能够处理千亿级参数,训练百TB级数据。训练模式领先。前三代GPT均采取无人参与的预训练机制,ChatGPT新增人类反馈强化训练。开生成式先河。以算力和训练数据为支撑,ChatGPT能够准确理解各类问题,给予具有一定逻辑的开放式回答;还能够与提问者进行连续对话,不断修正给出
2、的答案,这是前所未有的语言理解和表达能力。潜在价值巨大,未来ChatGPT技术与其他人工智能技术耦合,彻底改变人工智能生态的可能性极大。ChatGPT缺陷是?语料来源:语料不够充分或完全未覆盖的空白领域,ChatGPT很可能会给出误导性内容;与Bing搜索引擎耦合后,回答问题的准确性是否收到搜索引擎数据的干扰有待观察。运营成本:ChatGPT运营及训练成本高企,恐将制约未来发展。道德风险:无法避免ChatGPT故意提供虚假或提供带有攻击性的答案。2、如何改变银行业?机遇与挑战:银行客服,对于客服、催收等人工的替代,与ChatGPT关联最直接,或将开启深度智能化阶段。业务前端:对于财富管理、小微
3、客户、个人消费贷款等标准化产品,客户识别有望进一步细化,产品匹配有望更加精准。业务中端:诸如授信报告、审批报告、贷后管理报告等强格式性案头工作,如能以ChatGPT替代,可有效提高运营效率。科技基础:银行投入人工智能相关研究需要持续投入资源,特别是要投入支持模型运转及数据计算的算力资源。合规与成本:数据隐私:银行数据的特殊性决定了应用第三方技术的审慎性,应用技术须考虑本地化、私有化部署模式。系统稳定:银行不掌握ChatGPT核心技术,很难控制内容输出的正确性,也很难确保系统稳定运行,这在经营中存在很大风险。成本投入:无论是接入ChatGPT,还是自主开发类似功能,均须较大成本投入,是否能够实现
4、预期收益,存在不确定性。3、哪些银行有机会?在金融科技持续投入资源的银行。科技人员:披露数据的21家上市银行科技队伍总人数11.6万人,占从业总人数的5%;工行在绝对人数上一枝独秀达3.5万人以上,浦发、招行、工行科技人员占比最高。科技投入:披露数据的24家上市银行中科技投入近1600亿元,占营收的3%。四大行在科技投入绝对规模占有优势;长沙、平安、招行科技投入营收占比最高。4、风险提示:ChatGPT相关技术理念及技术路径出现质变,或被新技术替代;银行科技投入产出效能或不及预期。201什么是ChatGPT?是什么?强在哪?缺陷是?目录C O N T E N T S如何改变银行业?机遇与挑战i
5、合规与成本哪些银行有机会?科技人员i科技投入风险提示301C什ha么tG是PT?是什么?强在哪?缺陷是?4ChatGPT是什么?ChatGPT是具有划时代意义的自然语言处理模型自然语言处理,是人工智能最基础的领域。“图灵测试”作为人工智能的理论开端,其所提出的睑证标准,即在人与机器的问答中,如果人无法判断对方是人还是机器,则可判定机器具有人类智能。为了通过“图灵测试”,人类的探索大致可分为三个阶段:模式匹配:(1960s-90s)设置关键词与答案之间的线性匹配关系,如果提问者触发关键词,则向其提供已经预设好的答案。机器学习:(20 00 s)不再预先设置关键词与标准答案,而是向机器提供大量历史
6、资料,由机器自主总结规律、进行会话。神经网络:(2010s至 今)属于机器学习的进化分支。原理上是通过建模来模拟人类大脑100亿个神经元的结构。在2017年以前,主流模型为循环神经网络模型(R N N),处理语言时需要严格遵循语言的先后顺序,无法并行计算且容易出现长句语义理解困难等问题;2017年,Transformer模型被提出,它是对句子中的所有单词进行计算,算出词与词之间的相关度,可以同时学习大量文本。ChatGPT(结尾的 T 即指Transform er),就是将这一模型从理论变为现实的划时代应用。模式匹配机器学习神经网络代表应用示例说明Eliza(1966)Alice(1995)某
7、些网站客服仍适用这一模式。例如,将 退货”设置为关键词,绑定回答:问:请问退货该如何办理?答:如确认退货,请点 击“退货”链接。SmartChild(2001)SmarterChild 是最早集成到即时通讯平台的聊天机器人之一(AOL、MSN等),并迅速引起轰动,体验与早期Siri接近。RNN广泛应用于翻译软件TransformerChatGPTRNN与Transformer模型的差别之一可以理解为:对于同样一个英译中任务,A magazine is stuck in the gunRNN模型需要遵循单词出现的先后顺序,逐 词 理解和计算,当 gun”出现后,magazine才可以被准确理解为
8、“弹 夹 。如果句子太长,前后关联可能会失败。Transformer模型关注的是每个单词与句子中其他单词的关系,可以同步进行多词、多篇学习。同时,模型根据重要性和相关性程度,为词语赋予不同权重,使得重要词语能够获得较高权重,如此则即使在长文本中,也不会将重要信息丢失。51.2ChatGPT的强算力与大数据ChatGPT强在哪?ChatGPT最终爆火,离不开算力和数据量的持续升级。模型实质:所谓语言模型,实质是对词语序列的概率相关性建模,即对方说完一句话或一段话后,判断大概率继续出现的内容是什么。既然是概率相关性,自然是 大力出奇迹,样本越大,结果就越准确。同时,样本越大也自然就意味着对算力和资
9、金的消耗,从初代GPT到最终爆火的ChatGPT,模型并未发生实质改变,改变的是持续增长的资源投入。算力支持:2019年,微软为OpenAI(GPT开发公司)打造了一台全球排名第五的超级计算机,拥有超过28.5万个CPU核心,1万个G PU,每个GPU服务器的网络连接能力为400G b/s,支持GPT模型从初版的12个Transformer层进化到当下超过96个Transformer 层,可以理解为有更多的Transformer层就能够在语言与语言之间构建更复杂的逻辑联系。数据规模:GPT模型处理的参数量从初代的亿级成长到今天的千亿级,预训练数据量从GB级上升到百TB级。融 资情况:如此规模的
10、算力与数据必然需要巨额资金的支持,近4年,OpenAI从微软总计获得融资110亿美元。数据来源:浙商证券研究所根据新浪财经、IT技术精华、澎湃报道整理。版本发布时间Transformer 层数参数量预训练数据量GPT-12018年6月121.17 亿约5GBGPT-22019年2月4815亿40GBGPT-32020年5月961750亿45TBChatGPT2022年11月96+?干亿级?百TB级?61.2ChatGPT自主+人类反馈强化训|练ChatGPT强在哪?GPT通过自主训练充分发挥模型在效率上的优势,同时在ChatGPT版本中熠加人类反馈强化机制,使其结果更贴近人类想法。自主训练:G
11、PT-1到GPT-3,采用的都是GPT自主训练模式。所谓自主训练,近似于人类考试中的 完形填空 题目,即把一个完整文本的一部分遮住,GPT基于已学习结果进行推测,再与正确答案进行拟合的过程。自主训练过程,配合Transformer模型下强大的并行计算能力,能够高效完成超大数据量的学习和训练,这也是GPT表现优于其他模型的原因。人类反馈:GPT-3版本上线时,已经颇受业内人士认可,但并未出圈。ChatGPT此次能够破圈,与其采用对话聊天模式不无关系。相应地,在训练中增加人类反馈强化机制,对真实性、无害性和有用性进行评估。示例训练语料 自 主 训 练 基于语料库自主学习,可能会存在两个或多个矛盾结
12、果,模型无法自行判断正误:人 类 反 馈 对结果进行判断和调整:春眠不觉晓,处处闻啼鸟处处蚊子咬VX71.2ChatGPT将语言处理推向生成式时代,潜在价值巨大ChatGPT强在哪?凭借超强算力,基于超大数据的学习和训练,ChatGPT首次展示了强大的综合性语言材料生成能力。决策式A I:所谓决策式A I,即根据对历史概率的归纳给出是或否的决策;而生成式AI则需要给人力提供综合式的信息输出。生成式Al:ChatGPT是第一个功能如此强大的综合性文字生成式A I,它能够准确理解提问者的问题,收集材料后转化为具有一定逻辑的信息输出,它还能够与提问者进行连续对话,根据增量信息给出更准确回答,这是前所
13、未有的语言理解和表达能力。生成式AI决策式AI处理简答题处理选择题81.2ChatGPT将语言处理推向生成式时代,潜在价值巨大ChatGPT强在哪?语言即为指令,ChatGPT与其他领域人工智能技术的耦合,或将完全开启人工智能的新时代。ChatGPT+Whisper:OpenAI已经通过提供ChatGPT和Whisper的收费API接口,Whisper是OpenAI开发的语音处理工具,如将ChatGPT和Whisper功能进行耦合,可以得到无障碍的语言交流工具。所谓的语言,就是指令体系。随着指令体系的智能化,一切智能工具之间的边界或将逐渐模糊,人类与智能工具的关系或将彻底改变,AIGC(AI生
14、产内容)的时代将加速到来。9吧ChatGPT有哪些潜在挑战?ChatGPT缺陷是?ChatGPT风头一时无两,其潜在挑战在于语料库的范围及准确性、运营成本高及回答的道德风险等问题。语料来源:ChatGPT本质上仍是一个基于有限语料范围的概率归纳模型,它并不能对未知的事情像人类那样做常识性推演。与相关领域语料不够充分或完全未覆盖的领域,ChatGPT很可能会给出误导性内容;另外,微软计划将GPT-4与Bing搜索引擎深度耦合,搜索引擎庞杂的数据是否会对GPT-4的学习和训练带来负面干扰,仍需观察。运营成本:据报道,目前ChatGPT一次模型底座的训练需要500万美元的算力成本,在运营过程中需要大
15、量的算力支持其训练和部署。GPT-4与Bing耦合后,满足来自搜索引擎的搜索需求需要更大量的资源投入,如不解决成本问题恐将制约未来发展。道德风险:即使引入人类反馈,也不能100%避免ChatGPT故意提供虚假答案或回答带有攻击性的答案。1002银如行何业改?变 合机规遇与与成挑本战11机遇与挑战:主动革新?被颠覆?该如何理解ChatGPT可能会带来的潜在变革?像很多人担心的那样,会有大量工作被替代掉吗?ChatGPT的颠覆,本质上是人类生产力工具的再一次重大升级。就像过去三百年先后有蒸汽机和电被发明出来一样,固然有被这些新的生产力工具替代掉的人,也有更多的人利用新的工具创造了更多的财富。驾驭或
16、是被替代,只在一念之间。银行也是一样,ChatGPT是一次机会,一次全面升级流程的机会;错过则将是挑战,看着其他机构提高效率的挑战。从银行客服开始,无论是业务前台还是中后台,各项流程都有用ChatGPT重做一遍的潜力。银行客服:对于客服、催收等人工的替代,与ChatGPT关联最直接,银行应用最广泛,或将开启深度智能化阶段。业务前端:对于财富管理、小微客户、个人消费贷款等标准型产品,客户识别有望进一步细化,产品匹配有望更加精准。业务中端:诸如授信报告、审批报告、贷后管理报告等强格式性案头工作,如能以ChatGPT替代,可有效提高运营效率。科技基础:银行投入人工智能相关研究需要持续投入资源,特别是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 银行业 ChatGPT 如何 改变
限制150内