《大数据技术原理与操作应用》习题解答(六).docx





《《大数据技术原理与操作应用》习题解答(六).docx》由会员分享,可在线阅读,更多相关《《大数据技术原理与操作应用》习题解答(六).docx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据技术原理与操作应用习题解答(六)第八章一、单项选择题.当服务器突然宕机,以下Channels选项中,哪一个可以保证数据不会丧失。A、 Memory ChannelFile ChannelB、 JDBC ChannelD Kafka Channel参考答案:B.、以下关于flume的说法正确的选项是A Event是Flume数据传输的基本单元B Sink是Flume数据传输的基本单元C Channel是Flume数据传输的基本单元D Source是Flume数据传输的基本单元参考答案:A二、多项选择题1、以下选项中,说法错误的选项是()。A、在一个Agent中,同一个 source可以有多
2、个channelB、在一个Agent中,同一个sink可以有多个channelC、在一个Agent中,同一个source只能多1个channelD在一个Agent中,同一个sink只能有1个channel 参考答案:A, D10、Failover Sink Processor配置属性必备的参数是【】、processor, type和 processor, priority. o参考答案:【sinks】五、简答题1、简述故障转移接收器处理器的工作原理。参考答案:将故障的sink降级到故障池中,在池中为它们分配一个冷却期,在重试之前 冷却时间会增加,当sink成功发送event后,它将恢复到活跃池
3、中。sink具有与之相 关的优先级,数值越大,优先级越高。如果在发送event时sink发生故障,那么会尝试 下一个具有最高优先级的sink来继续发送evento如果未指定优先级,那么根据配置文件 中指定sink的顺序确定优先级。2、简述tail -F与-f的区别。参考答案:小f根据文件描述符进行追踪,当文件改名或被删除,追踪结束,-F按照文 件名进行追踪,并保持重试,即文件被删除或改名后,如果创立相同的文件名,那么继续 追踪O3、简述Flume负载均衡接收器处理器和故障转移接收器处理器的区别。参考答案:负载均衡接收器处理器中会让每一个活跃的sink轮流/随机的处理event; 而故障转移接收
4、器处理器只允许一个活跃的且优先级高的sink来处理event,只有在 当前sink故障后才会向下继续选择另一个活跃的且优先级高的sink来处理event。4、Flume采集数据会丧失吗?参考答案:不会,Channel中的数据可以存储在File中,数据传输自身有事务。5、什么是Flume拦截器。参考答案:Flume Interceptors (拦截器)主要用于实现对Flume系统数据流中event的操作。6、简述 flume-ng agent 的作用。参考答案:表示使用flume-ng启动一个agent7、编写一个采集类型是netcat的采集方案。参考答案:al.sources = rlal.s
5、inks = klal.channels = clal.sources, rl. type = netcatal.sources, rl. bind = localhostal.sources, rl. port = 44444al.sinks, kl. type = loggeral. channels, cl. type = memoryal. channels, cl. capacity = 1000al. channels, cl. transactionCapacity = 100al.sources, rl. channels = clal. sinks, kl. channel
6、= cl8、编写收集/root/logs/access. log文件的配置参数。参考答案:al sources, rl command = tail -F /root/logs/access. log9、选择Channel类型时,分别说明memory、和file的优缺点。参考答案: 选择Memory Channel时Channel的性能最好,但是如果Flume进程意外挂掉可能会丢失数据。中选择File Channel时Channel的容错性更好,Channel性能相比MemoryChannel 较低。10、简述 Memory Channel 特点。参考答案:读写速度快,但是存储数据量小,Flu
7、me进程挂掉、服务器停机或者重启都会导致数据丧失。资源充足、不关心数据丧失的场景下可以用。2、以下说法中,关于配置参数说法错误的选项是()。A、 al. sources, rl. channels = clal.sinks, kl. channel = clB、 al. source, rl. channels = clal. sinks, kl. channels = cl参考答案:C,D三、判断题1、在一个POST请求发送的所有的events数据,可以在多个事务中插入channel。对错参考答案:错答案解析:在一个POST请求发送的所有的events都被认为是一个批次,会在一个事务 中插入
8、channel o2、Flume负载均衡接收器处理器能够在多个Sink上进行均衡流量的功能。对错参考答案:对3、查询和替换拦截器基于Java正那么表达式提供了简单的用于字符串的搜索和替换功能, 同时还具有进行回溯/群组捕捉功能。对错 参考答案:对4、采集方案中的sources、channels、sinks是在具体编写时根据业务需求进行配置的,可以随意设置。对错参考答案:错5、Spooling Directory Source对指定磁盘上的文件目录进行监控并提取数据,但是不 能查看新增文件数据。对错参考答案:错答案解析:Spooling Directory Source对指定磁盘上的文件目录进行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据技术原理与操作应用 数据 技术 原理 操作 应用 习题 解答

限制150内