计算机视角解读ChatGPT投资机会-12页-2023-02-06.pdf





《计算机视角解读ChatGPT投资机会-12页-2023-02-06.pdf》由会员分享,可在线阅读,更多相关《计算机视角解读ChatGPT投资机会-12页-2023-02-06.pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 本报告版权属于安信证券股份有限公司,各项声明请参见报告尾页。1 20232023 年年 0202 月月 0606 日日 计算机计算机 行业周报行业周报 计算机视角解读计算机视角解读 ChaChatGPTtGPT 投资机会投资机会 证券研究报告证券研究报告 投资评级投资评级 领先大市领先大市-A A 维持维持评级评级 行业表现行业表现 资料来源:Wind 资讯 升幅升幅%1M1M 3M3M 12M12M 相对收益相对收益 5.8-0.5 6.3 绝对收益绝对收益 12.3 13.1-3.0 赵阳赵阳 分析师分析师 SAC 执业证书编号:S1450522040001 夏瀛韬夏瀛韬 分析师分析师
2、SAC 执业证书编号:S1450521120006 相关报告相关报告 22Q4 计算机板块基金持仓复盘 2023-01-30 优秀产品名单公示,工业软件赛道长坡厚雪价值大 2023-01-29 数据安全促使网安产业迈向新景气周期 2023-01-16 新型电力系统蓝皮书发布,数字能源产业有望加速 2023-01-08 广州车展如期举办,CES 开幕在即,智能车产业链仍是计算机投资主线 2023-01-02 源起:从源起:从 GPTGPT-1 1 到到 C ChatGPThatGPT,商用化进程逐渐开启,商用化进程逐渐开启 从从 GPTGPT-1 1 到到 GPTGPT-3.53.5,模型持续迭
3、代。,模型持续迭代。GPT(Generative Pre-Trained Transformer)系列是 OpenAI 公司的一系列预训练模型,通过Transformer 为基础模型,使用预训练技术得到通用的文本模型。目前已经公布论文的有文本预训练 GPT-1,GPT-2,GPT-3,以及图像预训练 iGPT,而 ChatGPT 和今年年初公布的 InstructGPT 是在 GPT-4之前发布的预热模型,也被叫做 GPT-3.5。ChatGPT 和 InstructGPT在模型结构,训练方式上都完全一致,即都使用了指示学习和人工反馈的强化学习来指导模型的训练,它们不同的仅仅是采集数据的方式上
4、有所差异。与之前的模型相比,ChatGPT 做到了在内容生成上的有在内容生成上的有用性,真实性和无害性用性,真实性和无害性,实现了算法和用户体验上的创新。微软全线产品微软全线产品整合整合,ChatGPTChatGPT 开启商用化进程。开启商用化进程。OpenAI 公司宣布推出ChatGPT 的新订阅计划,起价为每月 20 美元,可以享受更快的响应时间和优先访问。2 月 2 日,微软 CEO 宣布继搜索引擎必应、Office办公软件之后,将在云计算平台 Azure 中整合 ChaGPT,标志着微软有望实现 ChatGPT 在全线产品中的整合。我们认为 ChatGPT 的商用化进程逐渐开启。技术:
5、预训练模型技术:预训练模型+人工精标人工精标+强化学习,实现强化学习,实现 NLPNLP 技术创新技术创新 从技术角度来看,从技术角度来看,C ChatGPThatGPT 的模型实现主要分为三个步骤,合称为的模型实现主要分为三个步骤,合称为RLHFRLHF(Reinforcement Learning by Human FeedbackReinforcement Learning by Human Feedback)技术:技术:1 1)SFTSFT(Supervised(Supervised F Fine ine T Tuning):uning):基于 GPT-3 的预训练模型,采集新的数据用
6、 GPT-3 的训练方式对模型进行微调,这些数据一部分来自使用 OpenAI 的 PlayGround 用户,另一部分来自 OpenAI 雇佣的 40名标注工(labeler);2 2)训练)训练 RMRM(Reword Model)Reword Model):在采样的输入语句中,进行前向推理获得多个模型输出结果,通过人工标注进行这些输出结果的排序打标。最终这些标注数据用来训练 Reward 奖励模型。通过人工标注的方式来提供这个奖励,可以给那些涉及偏见的生成内容更低的分从而鼓励模型不去生成这些人类不喜欢的内容,实现模型的有用、真实和无害。3 3)PPOPPO(Proximal Policy
7、Optimization)Proximal Policy Optimization):随机抽取新的样本,用第二阶段的 Reward Model 给产生的回答打分。这个分数即回答的整体Reward,进而将此 Reward 回传,由此产生的策略梯度可以更新 PPO模型参数。整个过程迭代数次直到模型收敛。强化学习算法可以通过调整模型参数,使模型得到最大的奖励(Reward),最大奖励意味着此时的回复最符合人工的选择取向。-32%-22%-12%-2%8%2022-022022-062022-102023-02计算机计算机沪深沪深300300本报告仅供 Choice 东方财富 使用,请勿传阅。9995
8、63327 本报告版权属于安信证券股份有限公司,各项声明请参见报告尾页。2 行业周报行业周报/计算机计算机 我们认为 ChatGPT 的算法创新主要在于,采用人工标注排序的方式构建强化学习的奖励模型,从而实现了预训练模型和强化学习的融合。另一方面,第一阶段 GPT-3 的大模型以及高质量人工标注数据的微调也促使了模型更加有效。投资机会:布局投资机会:布局 NLPNLP 算法算法+数据标注数据标注+算力设施算力设施 从对于 ChatGPT 技术上的分析,我们可以看到自然语言处理技术的持续迭代升级,对应到当前市场来看,我们认为主要的发展方向和投资机会在于三个方向:1 1)NLPNLP 技术:技术:
9、由于 ChatGPT 主要基于自然语言处理,因为在 NLP 领域沉淀较多的企业有望率先实现功能的部分复现,建议关注科大讯飞、拓尔思。2 2)数据数据标注:标注:在 ChatGPT 的训练过程中,加大了人工标注的力度和精度,代表着未来在人工智能领域,优质的数据源和强大的标注能力将成为行业的基础设施,利好人工智能数据标注企业如海天瑞声。3 3)算力设施:)算力设施:我们可以看到 ChatGPT 主要源于 GPT-3 的预训练模型,而 GPT-3 相比于此前的模型,最大的不同在于模型体量的大幅提升,根据 OpenAI 的数据,GPT-3 的参数量达到 1750 亿个,训练数据量达到 45TB,而 G
10、PT-2 参数仅有 15 亿个,40GB 数据。因此,我们认为人工智能的跨越式发展,将成为算力流量消耗的重要驱动力,未来数据中心和相关的配套产业有望实现更好增长,建议关注润泽科技等。建议关注建议关注 基础工具:基础工具:普源精电-U、鼎阳科技、坤恒顺维、霍莱沃、概伦电子、华大九天。智能汽车:智能汽车:德赛西威、中科创达、四维图新、道通科技、虹软科技、万集科技。工业软件:工业软件:宝信软件、中望软件、中控技术、赛意信息、能科科技、鼎捷软件。数字能源:数字能源:朗新科技、国能日新、南网科技、龙软科技、国网信通、远光软件。人工智能:人工智能:科大讯飞、海康威视、大华股份、奥普特、商汤-W、寒武纪。网
11、络安全:网络安全:深信服、安恒信息、启明星辰、天融信、奇安信-U、信安世纪。风险提示风险提示 1)疫情加剧降低企业信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。本报告仅供 Choice 东方财富 使用,请勿传阅。行业周报行业周报/计算机计算机 本报告版权属于安信证券股份有限公司,各项声明请参见报告尾页。3 内容目录内容目录 1.本周行业观点.4 2.市场行情回顾.5 2.1.本周板块指数涨跌幅.5 2.2.本周计算机个股表现.6 3.重要行业新闻.7 3.1.数字金融.7 3.2.网络安全.7 3.3.工业软件与数字化转型.7 3.4.空天信息化、新兴技术与硬科
12、技.7 3.5.智能网联车.8 4.重点公司动态.9 4.1.基础软硬件.9 4.2.基础工具链.9 4.3.网络安全与数据安全.9 4.4.数字金融.10 4.5.智能网联车.10 4.6.AI 大数据应用.10 4.7.医疗信息化.10 4.8.数字能源.10 风险提示:.10 图表目录图表目录 图 1.本周各行业涨跌幅统计.5 表 1:本周各类指数行情统计.5 表 2:本周计算机个股涨跌幅统计.6 表 3:本周陆港通持股情况统计.6 本报告仅供 Choice 东方财富 使用,请勿传阅。行业周报行业周报/计算机计算机 本报告版权属于安信证券股份有限公司,各项声明请参见报告尾页。4 1.1.
13、本周行业观点本周行业观点 源起:从源起:从 GPTGPT-1 1 到到 ChatGPTChatGPT,商用化进程逐渐开启,商用化进程逐渐开启 从从 GPTGPT-1 1 到到 GPTGPT-3.53.5,模型持续迭代。,模型持续迭代。GPT(Generative Pre-Trained Transformer)系列是OpenAI 公司的一系列预训练模型,通过 Transformer 为基础模型,使用预训练技术得到通用的文本模型。目前已经公布论文的有文本预训练 GPT-1,GPT-2,GPT-3,以及图像预训练 iGPT,而 ChatGPT 和今年年初公布的 InstructGPT 是在 GPT
14、-4 之前发布的预热模型,也被叫做 GPT-3.5。ChatGPT 和 InstructGPT 在模型结构,训练方式上都完全一致,即都使用了指示学习和人工反馈的强化学习来指导模型的训练,它们不同的仅仅是采集数据的方式上有所差异。与之前的模型相比,ChatGPTChatGPT 做到了在内容生成上的有用性,真实性和无害性做到了在内容生成上的有用性,真实性和无害性,实现了算法和用户体验上的创新。微软全线产品整合,微软全线产品整合,ChatGPTChatGPT 开启商用化进程。开启商用化进程。OpenAI公司宣布推出 ChatGPT 的新订阅计划,起价为每月 20 美元,可以享受更快的响应时间和优先访
15、问。2 月 2 日,微软 CEO 宣布继搜索引擎必应、Office 办公软件之后,将在云计算平台 Azure 中整合 ChaGPT,标志着微软有望实现 ChatGPT 在全线产品中的整合。我们认为 ChatGPT 的商用化进程逐渐开启。技术:预训练模型技术:预训练模型+人工精标人工精标+强化学习,实现强化学习,实现 NLPNLP 技术创新技术创新 从技术角度来看,从技术角度来看,ChatGPTChatGPT 的模型实现主要分为三个步骤,合称为的模型实现主要分为三个步骤,合称为 RLHF(Reinforcement RLHF(Reinforcement Learning by Human Fee
16、dback)Learning by Human Feedback)技术:技术:1 1)SFT(Supervised Fine Tuning):SFT(Supervised Fine Tuning):基于 GPT-3 的预训练模型,采集新的数据用 GPT-3 的训练方式对模型进行微调,这些数据一部分来自使用 OpenAI 的 PlayGround 用户,另一部分来自 OpenAI 雇佣的 40 名标注工(labeler);2 2)训练)训练 RM(Reword Model)RM(Reword Model):在采样的输入语句中,进行前向推理获得多个模型输出结果,通过人工标注进行这些输出结果的排序打
17、标。最终这些标注数据用来训练 Reward 奖励模型。通过人工标注的方式来提供这个奖励,可以给那些涉及偏见的生成内容更低的分从而鼓励模型不去生成这些人类不喜欢的内容,实现模型的有用、真实和无害。3 3)PPO(Proximal Policy Optimization)PPO(Proximal Policy Optimization):随机抽取新的样本,用第二阶段的 Reward Model给产生的回答打分。这个分数即回答的整体 Reward,进而将此 Reward 回传,由此产生的策略梯度可以更新 PPO 模型参数。整个过程迭代数次直到模型收敛。强化学习算法可以通过调整模型参数,使模型得到最大
18、的奖励(Reward),最大奖励意味着此时的回复最符合人工的选择取向。我们认为 ChatGPT 的算法创新主要在于,采用人工标注排序的方式构建强化学习的奖励模型,从而实现了预训练模型和强化学习的融合。另一方面,第一阶段 GPT-3 的大模型以及高质量人工标注数据的微调也促使了模型更加有效。投资机会:布局投资机会:布局 NLPNLP 算法算法+数据标注数据标注+算力设施算力设施 从对于 ChatGPT 技术上的分析,我们可以看到自然语言处理技术的持续迭代升级,对应到当前市场来看,我们认为主要的发展方向和投资机会在于三个方向:1 1)NLPNLP 技术:技术:由于 ChatGPT 主要基于自然语言
19、处理,因为在 NLP 领域沉淀较多的企业有望率先实现功能的部分复现,建议关注科大讯飞、拓尔思。2 2)数据标注:)数据标注:在 ChatGPT 的训练过程中,加大了人工标注的力度和精度,代表着未来在人工智能领域,优质的数据源和强大的标注能力将成为行业的基础设施,利好人工智能数据标注企业如海天瑞声。3 3)算力设施:)算力设施:我们可以看到 ChatGPT 主要源于 GPT-3 的预训练模型,而 GPT-3 相比于此前的模型,最大的不同在于模型体量的大幅提升,根据 OpenAI 的数据,GPT-3 的参数量达到1750 亿个,训练数据量达到 45TB,而 GPT-2 参数仅有 15 亿个,40G
20、B 数据。因此,我们认为人工智能的跨越式发展,将成为算力流量消耗的重要驱动力,未来数据中心和相关的配套产业有望实现更好增长,建议关注润泽科技等。本报告仅供 Choice 东方财富 使用,请勿传阅。行业周报行业周报/计算机计算机 本报告版权属于安信证券股份有限公司,各项声明请参见报告尾页。5 2.2.市场行情回顾市场行情回顾 2.1.2.1.本周板块指数涨跌幅本周板块指数涨跌幅 本周上证综指下跌 0.04%,创业板指下跌 0.23%,沪深 300 指数下跌 0.95%。计算机行业指数上涨 4.88%,跑赢上证综指 4.92%,跑赢创业板指 5.11%,跑赢沪深 300 指数 5.83%。横向来看
21、,本周计算机行业指数在中信 30 个行业指数中排名第 2,在 TMT 四大行业(电子、通信、计算机、传媒)中位列第 1。表表1 1:本周各类指数行情统计本周各类指数行情统计 指数名称指数名称 周涨跌幅周涨跌幅 年初至今涨跌幅年初至今涨跌幅 周相对涨跌幅周相对涨跌幅 年初至今相对涨年初至今相对涨跌幅跌幅 计算机(中信)4.88%18.07%上证综指-0.04%5.64%4.92%12.43%深证成指 0.61%9.43%4.27%8.64%创业板指-0.23%9.94%5.11%8.13%沪深 300-0.95%6.97%5.83%11.10%云计算指数 6.10%18.71%-1.22%-0.
22、64%网络安全指数 5.58%17.42%-0.70%0.65%车联网指数 6.40%17.66%-1.52%0.41%资料来源:Wind,安信证券研究中心 图图1.1.本周各行业涨跌幅统计本周各行业涨跌幅统计 资料来源:Wind,安信证券研究中心 本报告仅供 Choice 东方财富 使用,请勿传阅。行业周报行业周报/计算机计算机 本报告版权属于安信证券股份有限公司,各项声明请参见报告尾页。6 2.2.2.2.本周计算机个股表现本周计算机个股表现 从涨跌幅情况来看,本周计算机板块整体表现较好。展望 2023 年,我们仍建议关注景气度向上的智能网联汽车、人工智能、工业软件和网络安全等产业的投资机
23、会。表表2 2:本周计算机个股涨跌幅统计本周计算机个股涨跌幅统计 周涨幅前十周涨幅前十 周跌幅前十周跌幅前十 周换手率前十周换手率前十 股票名称 周涨跌幅(%)股票名称 周涨跌幅(%)股票名称 周换手率(%)海天瑞声 71.03%御银股份-6.78%竞业达 147.71%初灵信息 62.63%左江科技-6.60%直真科技 146.33%同为股份 61.10%诚迈科技-4.70%科远智慧 137.76%汉王科技 61.05%顺利办-4.13%久其软件 133.13%拓尔思 36.57%安恒信息-4.01%中远海科 128.72%川大智胜 30.79%久远银海-3.05%初灵信息 123.22%开
24、普云 28.77%深信服-2.98%川大智胜 107.01%易联众 27.38%东方财富-2.80%拓尔思 99.69%光云科技 26.15%紫光股份-2.69%荣联科技 88.63%万兴科技 23.33%方正科技-2.67%榕基软件 82.38%资料来源:Wind,安信证券研究中心 从陆港通资金持股情况来看,本周持仓市值前十不变,同花顺代替神州泰岳进入持仓占比前十。从增持比例来看,同花顺、楚天龙和中望软件增持比例最多。表表3 3:本周陆港通持股情况统计本周陆港通持股情况统计 持仓市值前十持仓市值前十 持仓占比前十持仓占比前十 增持比例前十增持比例前十 股票名称股票名称 持仓市值持仓市值 (亿
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 视角 解读 ChatGPT 投资 机会 12 2023 02 06

限制150内