Spark编程基础及项目实践章节练习题项目7+答案.docx
-
资源ID:76385745
资源大小:19.09KB
全文页数:2页
- 资源格式: DOCX
下载积分:5金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
Spark编程基础及项目实践章节练习题项目7+答案.docx
习题7答案1.选择题(1)在无向图中所有顶点的度之和等于边数的( C )倍A. 1/2B. 1C. 2D. 4(2)在图的创建过程中,哪个不是图的创建方法( C )。A. applyB. fromEdgesC. fromVertexsD. fromEdgeTuples(3)下面哪个属性是图无法获取到的( C )。A. VertexRDDB. numVerticesC. EdgeVertexD. EdgeRDD (4)下面哪个不是图内部存在的操作( D )。A. 图结构转换操作B. 图关联操作C. 图近邻聚合操作D. 图划分操作(5)在图的属性转换过程中,哪个不是图的属性转换方法( C )。A. mapEdgesB. mapTripletsC. mapDegreeD. mapVertices2.操作题 使用Hadoop用户名登录Linux系统,启动Spark-shell,使用Hadoop提供的Shell完成如下操作:(1)引入Spark Streaming相关包,并创建一个“/home/graph.txt”,并根据这个文本文件生成一个图,要求其中有四个顶点,顶点属性与边的指向自定义。例如:文本内容为:000000261066,小明585,3044070630,redashuaicheng,1929305865,1994,229,3472,male,first代码为:val records: RDDString = sc.textFile("/opt/followers.txt")val followers=records.map case x => val fields=x.split(",") | Edge(fields(2).toLong, fields(4).toLong,1L ) | val graph=Graph.fromEdges(followers, 1L)(2)在spark-shell将上述已经创建好的图,获取图的三元组、边、顶点属性并查看。使用方法如下:abstract val vertices: VertexRDDVD通过方式Graph.vertices调用图的顶点属性,返回一组包含顶点ID和顶点属性的VertexRDD。abstract val edges: EdgeRDDED通过方式Graph.edges调用图的边属性,返回一组包含源顶点ID、目的顶点ID和边属性的EdgeRDD。abstract val triplets: RDDEdgeTripletVD, ED通过方式Graph.triplets调用图的三元组属性,返回 RDDEdgeTripletVD, ED。(3)下载数据集https:/snap.stanford.edu/data/com-Youtube.html中的page-rank-yt-data.txt文件,然后对这个文件使用PageRank算法,进行分析,计算得到受欢迎程度最高的前五名用户。请参考实战项目二的操作流程,进行分析。