《教育科学学院学生实验报告.docx》由会员分享,可在线阅读,更多相关《教育科学学院学生实验报告.docx(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、教育科学学院学生实验报告学 期:20 20 -20 21学年度第上学期课程名称:教育研究方法综合训练评阅成绩:评阅教师签名:20 20年9月 日(二)理解两种分析方法的联系重复上述实验,研究两种分析方法的联系。1 .实验文本描述(包括主要内容、页数、字数).两种分析方法的结果(可以仅显示自己要分析的部分内容)(1)基于词向量的层次聚类分析结果(2)基于词共现矩阵的分析结果.两种分析方法的共同点2 .两种分析方法的差异.两种分析方法适用场合分析(三)分析结果解读.实验文本描述(包括主要内容、页数、字数).实验结果呈现(可以仅显示自己要分析的部分内容)1 .根据分析结果解读输入文本(可结合两种分析
2、方法解读,也可以选择一种自己认为更有解释力的结果解读)二、实验结论(从影响实验结果的因素及如何影响、实验操作的评价、实验结果的评价、实验方法的可行性与有效性、实验方法存在的问题等方面讨论)三、实验讨论(重点讨论实验方法存在的问题、如何增强实验效果)实验(三)关键词关系网络分析完成时间:2020年9月实验用时:小时完成方式:独立完成小组完成(本小组为第一组)小组组员:一、预习要求通过查阅资料:1.理解什么是关系网络分析,了解关系网络分析 适用的场合及其可能存在的问题。2.了解如何根据词向量进行关系网 络分析。3.了解如何利用词共现矩阵进行关系网络分析。3.了解两种 关系网络分析方法的联系。二、实
3、验目的和要求目的:掌握基于向量的关系网络分析方法。要求:1.通过实验进一步熟悉两种不同关系网络分析方法的原理。2.通过实验掌握利用系统进行关系网络分析的方法。3.掌握解释分析 结果的方法。二,实验环境与条件由学生组成小组通过网络与其他渠道进行相关资料的收集、整理 与分析;利用“基于人工智能的在线文本内容分析系统”完成实验。三、实验内容(一)掌握聚类分析方法的操作输入文本,产生关键词后,学会选择关键词的方法;学会选择不 同分析方法及设置参数的方法;学会通过修改画布参数和拖动节点来 快速布局,以加快自动调整的速度、优化分析结果、体现自己的理解 的方法;学会当对布局满意时,保存布局的节点的方法。(二
4、)理解两种分析方法的差异与联系对比词向量层次聚类分析和词共现层次聚类分析的结果,讨论两 分析方法共同点和不同点。(三)学会解释分析结果找一篇自己要分析的内容(最好数据量比较大,比如起码有几十 页),通过这两种方式来分析,生成分析结果后,自己根据结果来解 释文本。(三)实验结论总结实验操作、分析结果的呈现、对分析结果的解读等内容,说 明这种分析方法的合理性和可行性(四)实验讨论根据查阅文献和自己实际操作的体会,讨论如何更好地利用这种 方法来分析文本,并解释分析的结果;理解这种方式的局限性。一、实验过程(一)掌握关键词关系网络分析方法的操作(采用几百字的小批量文本实验,要求记录操作过程与其中所涉及
5、到的数据,并对操作结果进 行评述).实验文本描述1 .关系网络分析操作过程及数据(1)输入文本(2)选择关键词、选择分析方法、输入参数(3)优化分析结果(记录自己对操作的体会)4.操作结果评述(分析关键词、方法、参数等对分析结果的影响)(二)理解两种分析方法的联系.实验文本描述(包括主要内容、页数、字数).两种分析方法的结果(可以仅显示自己要分析的部分内容)(1)基于词向量的层次聚类分析结果(2)基于词共现矩阵的分析结果1 .两种分析方法的共同点.两种分析方法的差异2 .两种分析方法适用场合分析(三)分析结果解读.实验文本描述(包括主要内容、页数、字数等).实验结果呈现(可以仅显示自己要分析的
6、部分内容).根据分析结果解读输入文本(可结合两种分析方法解读,也可以选择一种自己认为更有解释力的结果解读)二、实验结论(从影响实验结果的因素及如何影响、实验操作的评价、实验结果的评价、实验方法的可行性与有效性、实验方法存在的问题等方面讨论)三、实验讨论(重点讨论实验方法存在的问题、如何增强实验效果)实验(四)短文本聚类分析完成时间:2020年9月实验用时:小时完成方式:口独立完成小组完成(本小组为第一组)小组组员:一、预习要求通过查阅资料:1.了解当前短文本分析的一般方法,理解这类方 法在应用中的局限。2.尝试理解如何根据词向量获得一个句子的向 量,以及这种句向量表示中存在的问题。3.尝试理解
7、短文本聚类分析 的原理。二、实验目的和要求目的:掌握短文本聚类分析方法。要求:1.通过实验掌握短文本聚类分析的方法。2.掌握解释分析 结果的方法。二、实验环境与条件由学生组成小组通过网络与其他渠道进行相关资料的收集、整理 与分析;利用“基于人工智能的在线文本内容分析系统”完成实验。 三、实验内容(一)掌握短文本聚类分析的操作输入文本,输入聚类数量后,选择不同的结果呈现模式,直接生 成分类。(二)学会解释分析结果找一篇自己要分析的内容(最好数据量比较大,比如起码有几十 页),通过这种方式来分析,生成分析结果后,自己根据结果来解释 文本。(三)实验结论总结实验操作、分析结果的呈现、对分析结果的解读
8、等内容,说 明这种分析方法的合理性和可行性(四)实验讨论根据查阅文献和自己实际操作的体会,讨论如何更好地利用这种 方法来分析文本,并解释分析的结果;理解这种方式的局限性。一、实验过程(一)掌握短文本聚类分析方法的操作(选择几类短文本,每类几条,打乱顺序后进行测试).实验文本描述(说明文本来源,分为几类,每类有多少条).关系网络分析操作过程及数据(1)输入文本(2)选择输入分类数量,取消选择“仅输出分类统计信息”(3)查看统计结果,确定是否与原始分类一致,如果不一致,分析原因(逐一分析分类结果与原始数据是否一致,理解这种算法的合理性及局限)(4)选择“仅输出分类统计信息”,查看统计结果4.操作结
9、果评述(分析分类数量这一参数对分析结果的影响,分析结果是否准确)(二)海量短文本聚类分析及其分析结果解读(少量文本,要求至少500条短文本).实验文本描述(主要内容、页数、字数).简要描述分析过程(包括步骤、参数,要特别重视增大分类数量后观察分类结果,经过多次尝试后得到分类结果;最后要合并相似分类的结果,以聚焦分析结论。)实验报告书写要求实验报告原则上要求学生手写,要求书写工整。若因课程特点需 打印的,要遵照报告文档指定的字体、字号、间距等的具体要求。纸 张一律采用A4幅面,双面打印。实验报告书写说明首先填写实验报告封面中划横线的内容。实验报告第一部分为实验的基本信息,包括实验原理、实验目的
10、和要求、实验环境与条件等内容;第二部分为实验报告正文,包括实 验过程、实验结论、实验讨论等,由学生填写。报告册中用圆括号括 起来的红色加粗文字为指导语,完成报告册后可删除。填写注意事项(1)实验前认真完成预习作业;实验时根据实验要求选择实验 方法、设计实验步骤,并根据要求及时、准确、如实记录实验数据和 观察到的结果。(2)报告撰写时尽量采用专用术语来说明事物,要求用语准确、 逻辑清晰、言之有据。(3)外文、符号、公式要准确,应使用统一规定的名词和符号。(4)各小组或个人应独立完成实验报告的撰写,严禁抄袭、复 印,一经发现,以零分论处。实验报告批改说明实验报告的批改要及时、认真、仔细,一律用红色
11、笔批改。实验 报告的批改成绩采用十分制,具体评分标准由指导教师根据实验要求 确定。实验报告装订要求实验报告批改完毕后,任课老师将每门课程的每个实验项目的实 验报告以教学班为单位、按学号升序排列,装订成册,并附上一份该 门课程的实验大纲。3 .实验结果呈现(仅统计信息,可以挑一个分类的结果出来详细分析).分析结果评述(你自己理解的分类及系统的分类,讨论系统分类是否合理,有什么局限,有什么办法可以提 高分类的质量。).根据分析结果解读原始文本二、实验结论(从影响实验结果的因素及如何影响、实验操作的评价、实验结果的评价、实验方法的可行性 与有效性、实验方法存在的问题等方面讨论)三、实验讨论(重点讨论
12、实验方法存在的问题、如何增强实验效果)实验(五)概念编码完成时间:2020年9月实验用时:小时完成方式:独立完成小组完成(本小组为第一组)小组组员:一、预习要求通过查阅资料:1.理解什么是聚类分析、什么是层次聚类分析,了解聚类分析适用的场合及其可能存在的问题。2.了解什么是词向 量、如何根据词向量进行层次聚类分析。3.什么是词共现矩阵,如何 利用词共现矩阵进行层次聚类分析。二、实验目的和要求目的:掌握基于向量的层次聚类方法。要求:1.通过实验进了步熟悉两种不同层次聚类方法的原理。2.通过实验掌握利用系统进行层次聚类分析的方法。3.掌握调整分析结 果的布局和形式的方法。4.掌握解释分析结果的方法
13、。二,实验环境与条件由学生组成小组通过网络与其他渠道进行相关资料的收集、整理 与分析;利用“基于人工智能的在线文本内容分析系统”完成实验。三、实验内容(一)掌握聚类分析方法的操作输入文本,产生关键词后,学会选择关键词的方法;学会选择不 同分析方法及设置参数的方法;学会通过修改画布参数和拖动节点来 快速布局,以加快自动调整的速度、优化分析结果、体现自己的理解 的方法;学会当对布局满意时,保存布局的节点的方法。(二)理解两种分析方法的差异与联系对比词向量层次聚类分析和词共现层次聚类分析的结果,讨论两 分析方法共同点和不同点。(三)学会解释分析结果找一篇自己要分析的内容(最好数据量比较大,比如起码有
14、几十 页),通过这两种方式来分析,生成分析结果后,自己根据结果来解 释文本。(三)实验结论总结实验操作、分析结果的呈现、对分析结果的解读等内容,说 明这种分析方法的合理性和可行性(四)实验讨论根据查阅文献和自己实际操作的体会,讨论如何更好地利用这种 方法来分析文本,并解释分析的结果;理解这种方式的局限性。一、实验过程(一)掌握通过节点编码实现概念编码的操作(二)分析结果解读.实验文本描述(包括主要内容、页数、字数等).实验结果呈现(可以仅显示自己要分析的部分内容).分析结果解读二、实验结论(从影响实验结果的因素及如何影响、实验操作的评价、实验结果的评价、实验方法的可行性与有效性、实验方法存在的
15、问题等方面讨论)三、实验讨论(重点讨论实验方法存在的问题、如何增强实验效果)实验(一)基于TF-IDF的关键词提取完成时间:2020年9月实验用时:小时完成方式:独立完成小组完成(本小组为第一组)小组组员:一、预习要求通过查阅资料理解利用TF-IDF提取关键词的这一方法的原理、计 算过程和影响因素,了解这一算法的合理性和可能存在的问题。二、实验目的和要求目的:理解TF-IDF关键词提取算法的原理以及影响其效果的因 素,为文本内容分析打下基础。要求:L通过实验理解TF-IDF算法的合理性。2.通过实验理解影 响TF-IDF算法的效果。3.通过实验理解影响TF-IDF算法的因素。4. 通过实验理解
16、TF-IDF算法的重要性。二、实验环境与条件由学生组成小组通过网络与其他渠道进行相关资料的收集、整理 与分析;利用“基于人工智能的在线文本内容分析系统”完成实验。 三、实验内容(一)影响TF-IDF效果因素研究使用较短的文本作为分析对象,完成以下实验:1 .研究分词词性:选择不同词性,分析得到的关键词的不同,理解记 性对关键词的影响;.研究保留词和停用词:通过设置不同的保留词和停用词理解其对 算法结果的影响。(二)TF-IDF关键词提取效果评价设置好保留词和停用词后,记录不同文本所提取出来的关键词。讨论这种方法提取关键词与自己理解的关键词的区别与联系。(三)TF-IDF使用价值分析使用海量文本
17、作为对象,尝试自己总结文本的关键词;再用软件 提取关键词,试从这种方法所用的时间和质量讨论其对海量文本处理 的意义。(四)实验讨论.从算法的原理入手,思考提高算法效果还有哪些可能的做法。1 .查阅资料,了解其他提取关键词的算法,根据文献了解各类算法的 优缺点。一、实验过程(一)影响TF-IDF效果因素研究(要求记录操作过程与其中所涉及到的数据,并对操作结果进行评述).实验文本(如果文本数据量过大,仅显示前几段即可)1 .分词词性对TF-IDF效果的影响.保留词和停用词对TF-IDF效果的影响(二)TF-IDF关键词提取效果评价(小规模文本研究,可选择几百个字的文本分析).实验文本1 .自己理解
18、的关键词. TF-IDF提取的关键词2 .比较分析(三)TF-IDF使用价值分析(要求使用海量文本,至少100K以上).实验文本描述(包括主要内容、页数、字数).自己提取的关键词,以及其中面临的问题1 . TF-IDF提取的关键词.比较分析(从所用时间和提取出来的质量两个角度来分析). TF-IDF对提取海量文本关键词的作用二、实验结论(从影响实验结果的因素及如何影响、实验操作的评价、实验结果的评价、实验方法的可行性 与有效性、实验方法存在的问题等方面讨论)三、实验讨论(重点讨论实验方法存在的问题、如何增强实验效果)实验(二)关键词层次聚类分析完成时间:2020年9月实验用时:小时完成方式:独
19、立完成小组完成(本小组为第一组)小组组员:一、预习要求通过查阅资料:1.理解什么是聚类分析、什么是层次聚类分析, 了解聚类分析适用的场合及其可能存在的问题。2.了解什么是词向 量,利用词向量进行层次聚类分析的原理。3.了解什么是词共现矩阵, 利用词共现矩阵进行层次聚类分析的原理。4.了解词向量和共现矩阵 分析的联系。二、实验目的和要求目的:掌握基于向量的层次聚类方法。要求:1.通过实验进了步熟悉两种不同层次聚类方法的原理。2.通过实验掌握利用系统进行层次聚类分析的方法。3.掌握调整分析结 果的布局和形式的方法。4.掌握解释分析结果的方法。二、实验环境与条件由学生组成小组通过网络与其他渠道进行相
20、关资料的收集、整理 与分析;利用“基于人工智能的在线文本内容分析系统”完成实验。三、实验内容(一)掌握聚类分析方法的操作输入文本,产生关键词后,学会选择关键词的方法;学会选择不 同分析方法及设置参数的方法;学会通过修改画布参数和拖动节点来 快速布局,以加快自动调整的速度、优化分析结果、体现自己的理解 的方法;学会当对布局满意时,保存布局的节点的方法。(二)理解两种分析方法的差异与联系对比词向量层次聚类分析和词共现层次聚类分析的结果,讨论两 分析方法共同点和不同点。(三)学会解释分析结果找一篇自己要分析的内容(最好数据量比较大,比如起码有几十 页),通过这两种方式来分析,生成分析结果后,自己根据
21、结果来解 释文本。(三)实验结论总结实验操作、分析结果的呈现、对分析结果的解读等内容,说 明这种分析方法的合理性和可行性(四)实验讨论根据查阅文献和自己实际操作的体会,讨论如何更好地利用这种 方法来分析文本,并解释分析的结果;理解这种方式的局限性。一、实验过程(一)掌握关键词层次聚类分析方法的操作(采用几百字的小批量文本实验,要求记录操作过程与其中所涉及到的数据,并对操作方法和 结果进行评述).实验文本描述1 .关键词层次聚类分析操作过程及数据(1)输入文本(2)选择关键词和分析方法(3)优化分析结果A、使用快速布局工具,选择“超大画布”,实现快速布局B、使用快速布局工具,根据节点和连线分布情况,逐渐选择较小的画布C、手动拖动节点,进一步优化显示效果D、必要情况下,可双击节点,打开节点进行编辑E、如果需要,可以将节点信息导出,便于以后再次生成分析结果2 .操作方法评述(记录自己对操作的体会).操作结果评述(分析关键词、方法、参数等对分析结果的影响)
限制150内