新股上市时合理定价区间预测daja.pptx
《新股上市时合理定价区间预测daja.pptx》由会员分享,可在线阅读,更多相关《新股上市时合理定价区间预测daja.pptx(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、新股上市合理定价区间预测新股上市合理定价区间预测二五年四月第 1 页日期:2023/5/14目录目录1.1.项目概述项目概述 2.2.时间安排时间安排 3.3.研究内容研究内容 4.4.团队分工团队分工 5.5.源数据表源数据表6.6.数据预处理数据预处理7.7.数数据转换和处理据转换和处理数数据转换和处理据转换和处理8.8.数据模型演算及项目展望数据模型演算及项目展望9.9.知识发现知识发现第 2 页日期:2023/5/14项目目的项目目的1.11.11.11.1项目目的项目目的 基金金融工程数据库中有着中国一千多只股票及几百只基金的基础财务数据、股权信息、资本运作信息及每个交易日的行情公告
2、信息。金融工程数据库是一个海量的数据。作为基金管理单位,针对如此海量的信息记录,如何保证从这些数据中提取关键信息,找到有潜力的股票,改善持股结构,为基金管理部门相关决策提供依据与向导,是我们数据挖掘的目的。因为这个题目太大,我们选择其中一个较小范围的新股发行方面的数据进行挖掘。新股发行时,每个股票有所属行业,募集资金合计,发行市盈率,二级市场配售发行数量,预测净利润,上市首日表现等可统计信息。对这些数据进行挖掘,预测某只规模的新股上市时合理定价区间。过程中需要运用数据挖掘课程中的一些关键技术和思想,比如聚类分析、OLAP、决策树等方法体现在数据的抽取、数据的存储和管理、数据的展现和预测价值等过
3、程中。第 3 页日期:2023/5/14项目步骤确定项目目标;选取典型范围的新股上市的数据源与相关数据字典;数据库建立与数据清理工作;定义数据堆积维度和衡量值;确定数据挖掘的理论方法(聚类、决策树);学会应用Microsoft SQL Server 2000 Enterprise 和Analysis Server OLAP/Data Mining工具;设计定义挖掘模型和算法;预测结果测试。1.2 1.2 项目步骤项目步骤 第 4 页日期:2023/5/14项目概述项目概述1.3 1.3 项目步骤图项目步骤图 项目步骤图第 5 页日期:2023/5/141.4 1.4 工具介绍工具介绍 SQL
4、Server 2000 为用户提供了大规模联机事务处理(OLTP)、数据仓库和电子商务应用程序所需的最新的出色数据库平台。SQL Server 2000 为用户提供了完全集成的可扩展标记语言(XML)环境、在分析服务中添加了新的数据挖掘功能、用元数据服务增强了知识库技术 项目概述项目概述工具介绍第 6 页日期:2023/5/14目录目录1.1.项目概述项目概述 2.2.时间安排时间安排 3.3.研究内容研究内容 4.4.团队分工团队分工 5.5.源数据表源数据表6.6.数据预处理数据预处理7.7.数数据转换和处理据转换和处理数数据转换和处理据转换和处理8.8.数据模型演算及项目展望数据模型演算
5、及项目展望9.9.知识发现知识发现第 7 页日期:2023/5/14总体时间安排总体时间安排小组各成员分工协作,完成各自的目标小组各成员分工协作,完成各自的目标完成课题报告初稿完成课题报告初稿开题预备开题预备报告定稿,答辩报告定稿,答辩 4月16日4月18日4月20日4月22日4月24日4月26日4月28日4月30日5月2日5月4日5月6日5月8日5月10日提交结果报告提交结果报告确定课题研究内容和方向确定课题研究内容和方向并明确各成员分工并明确各成员分工 课题研究课题研究课题结束课题结束第 8 页日期:2023/5/14目录目录1.1.项目概述项目概述 2.2.时间安排时间安排 3.3.研究
6、内容研究内容 4.4.团队分工团队分工 5.5.源数据表源数据表6.6.数据预处理数据预处理7.7.数数据转换和处理据转换和处理数数据转换和处理据转换和处理8.8.数据模型演算及项目展望数据模型演算及项目展望9.9.知识发现知识发现第 9 页日期:2023/5/14研究内容研究内容3.1 3.1 建立建立基本概念基本概念 q数据挖掘概念;q可用于数据挖掘的数据类型;q数据挖掘功能及挖掘类型的模式;q数据挖掘系统了解;q数据挖掘预处理;q决策树概念与算法了解;q其它挖掘模式的了解;建立基本概念第 10 页日期:2023/5/143.2 3.2 数据源数据源 q基金金融工程数据库;q新股发行主要部
7、分;q证券列表,公司列表,板块列表;q上市公司财务数据;q股票交易数据;q上市公司股权信息;q上市公司高管信息;q其他信息(法人代表、注册地址、邮编、电话等);研究内容研究内容数据源第 11 页日期:2023/5/143.3 3.3 算法研究算法研究 基本上我们小组采用决策树算法。决策树算法是以树的结构显示的分类形式,其中树结构中的节点代表进一步对数据进行分类的单个问题。创建决策树的各种方法数十年来广泛使用,而且有大量的著作讲述这些统计技术。决策树挖掘模型使用名为递归分区的过程,根据事例集提供的特性将数据划分为若干个分区。然后,它将这些新建分区划分为更多的分区,并且一直划分下去,直到无法执行有
8、用的划分。研究内容研究内容算法研究第 12 页日期:2023/5/14目录目录1.1.项目概述项目概述 2.2.时间安排时间安排 3.3.研究内容研究内容 4.4.团队分工团队分工 5.5.源数据表源数据表6.6.数据预处理数据预处理7.7.数数据转换和处理据转换和处理数数据转换和处理据转换和处理8.8.数据模型演算及项目展望数据模型演算及项目展望9.9.知识发现知识发现第 13 页日期:2023/5/14团队分工团队分工 小小组组各各成成员员都都分分别别负负责责课课题题的的一一部部分分研研究究内内容容,每每个个人人都都是是课题能顺利完成不可缺少的一部分。课题能顺利完成不可缺少的一部分。第 1
9、4 页日期:2023/5/14目录目录1.1.项目概述项目概述 2.2.时间安排时间安排 3.3.研究内容研究内容 4.4.团队分工团队分工 5.5.源数据表源数据表6.6.数据预处理数据预处理7.7.数数据转换和处理据转换和处理数数据转换和处理据转换和处理8.8.数据模型演算及项目展望数据模型演算及项目展望9.9.知识发现知识发现第 15 页日期:2023/5/141.1.1.1.1行情行情(TB_OBJECT_1120)主键:OB_OBJECT_ID唯一性约束:(F1_1120,F2_1120)序号序号字段字段字段名字段名1OB_OBJECT_ID对象ID2F2_1120日期3F1_112
10、0证券ID4F4_1120昨收盘价5F5_1120开盘价6F6_1120最高价7F7_1120最低价8F8_1120最新价9F9_1120成交量(手)10F11_1120成交金额(千元)行情(TB_OBJECT_1120)行情第 16 页日期:2023/5/14新股发行(TB_OBJECT_1095)序号序号字段字段字段名字段名1OB_OBJECT_ID对象ID2F1_1095证券ID3F72_1095发行对象4F13_1095上网发行代码5F42_1095上网发行简称6F64_1095投标询价申购价格下限7F63_1095投标询价申购价格上限8F8_1095面值9F10_1095发行价格10
11、F9_1095货币代码新股发行第 17 页日期:2023/5/14证券(TB_OBJECT_1090)序号序号字段字段字段名字段名1OB_OBJECT_ID对象ID2F16_1090交易代码3F22_1090交易代码24OB_OBJECT_NAME_1090证券简称5F3_1090简称拼音6F4_1090证券类型代码证券第 18 页日期:2023/5/142.数据仓库模型设计及建立序号序号字段字段字段名字段名1OB_OBJECT_ID证券简称2DP大盘涨跌情况3LTG流通股大小4HY5SYL市盈率6ZF上市首日涨幅上市首日涨幅行业大类数据仓库第 19 页日期:2023/5/14目录目录1.1.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 新股 上市 合理 定价 区间 预测 daja
限制150内