数据可视分析挑战赛-挑战1-参考答案d.docx
《数据可视分析挑战赛-挑战1-参考答案d.docx》由会员分享,可在线阅读,更多相关《数据可视分析挑战赛-挑战1-参考答案d.docx(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、ChinaVis 2018 数据可视分析挑战赛 挑战 1 评审指南第 1 页ChinaVis Data Challenge 2018挑 战 一 评 审 指 南本文档针对挑战一给出了详细的评审指南,涵盖了作品提交、问题背景、数据说明、提交给参赛者的任务、潜在答案以及数据中支持这些答案的证据。挑战赛有关问题的完整说明以及向参与者提供的数据,请访问 http:/www.chinavis.org/2018/challenge.html。一、提交要求作品提交要求:(1)答卷:要求参赛者在完成对数据的可视分析后,用图文并茂的方式准确地回答官方预设的问题,以 Word 或 PDF 格式提交;(2)视频:要求
2、参赛者制作带解说的视频,用于解释其可视分析流程,以 WMV 格式提交,视频总长度不超过 5 分钟,视频数量 1 个;(3)论文:要求参赛者以论文形式,总结其可视分析方案的特点,论文格式要求与 ChinaVis论文格式要求一致,篇幅不超过两页,以 Word 或 PDF 格式提交;二、背景说明HighTech 是一家互联网高科技公司,有几百名员工,分属财务、人力资源和研发三个部门。公司正在全力研发一款重量级新产品,近期该产品临近发布,公司对内部发生的一切异常现象都非常敏感。为了维护公司的核心利益,确保新产品顺利发布,公司高层决定临时成立内部威胁情报分析小组,该小组将根据公司内部采集到的数据,分析并
3、处置可能存在的各种安全威胁。在分析威胁情报过程中,数据的复杂性需要计算机的处理,但发现、分析与处置安全威胁需要人的经验、认知与判断,可视分析技术能将计算智能与人类智慧这两者紧密结合,通过结合可视化、数据挖掘与人机交互技术,成为威胁情报人员高效分析和理解威胁情报数据的利器。假设您是威胁情报分析小组的成员,请您设计并实现一套可视分析解决方案,帮助该公司及时准确地找出可能存在的内部威胁情报。三、数据支持给参赛者提供了以下数据支持:ChinaVis 2018 数据可视分析挑战赛 挑战 1 评审指南第 2 页员工登录日志、员工网页访问日志、TCPLOG 日志、邮件日志、员工打卡日志。登录日志:员工通过自
4、己主机或跳板机的应用程序,登录服务器或数据库时生成的日志。例如使用 SSH、SCP 命令、XSHELL 程序或者 SFTP 传输文件都会产生远程登录日志;客户端应用程序访问数据库时,会产生数据库登录日志。login.csv字段名称 字段含义 相关说明time 日志生成时间user 用户名 登录使用的用户名proto 应用的协议 例如 ssh、mysql 等dip 目的 IP 被登录 IPdport 目的端口 被登录端口sip 源 IP 登录发起 IPsport 源端口 登录发起端口state 登录结果 成功或者失败网页访问日志:该日志记录了公司内部所有员工的网页访问记录。time 是该条记录生
5、成时间,sip 是客户端 IP,sport 是客户端端口,dip 是服务器 IP,dport 是服务器端口,host 是服务器域名。如果通过 IP 地址直接访问网站,不需要 DNS 服务器解析,HTTP 报头的 host 字段为空字符串。weblog.csv字段名称 字段含义 相关说明time 日志生成时间sip 源 IP 客户端 IPsport 源端口 客户端应用端口dip 目的 IP 服务端 IPdport 目的端口 服务端应用端口host 请求的域名 HTTP 报头的 host 字段TCPLOG 日志:记录公司内部网络活动产生的 TCP 连接。 stime、dtime 分别是连接建立和断
6、开时间。proto 是 IP 包头中的协议字段值。sip、dip 分别是连接发起者和接受者的 IP 地址,sport、dport 是与之对应的源与目的端口。整个连接过程中,sip 向 dip 发送的总字节数为ChinaVis 2018 数据可视分析挑战赛 挑战 1 评审指南第 3 页uplink_length,downlink_length 与之相反。员工的登录行为、网页访问行行为、邮件发送或者接收行为等都会产生一条或者多条 TCPLOG 日志。tcpLog.csv字段名称 字段含义 相关说明stime TCP 数据流开始时间 TCP 流的开始时间,即收到该流的第一个 SYN 包的时间dtim
7、e TCP 数据流结束的时间 TCP 流的结束时间,即收到该流的最后一个包的时间proto 协议 IP 包头中的协议字段值dip 目的 IP TCP 数据流的服务端 IPdport 目的端口 TCP 数据流的服务端应用端口sip 源 IP TCP 数据流的客户端发起 IPsport 源端口 TCP 数据流的客户端应用端口uplink_length 上行字节数从 TCP 流的建立到该流的结束,从客户端发往服务器端的应用层数据的字节总数downlink_length 下行字节数从 TCP 流的建立到该流的结束,从服务器端发往客户端的应用层数据的字节总数邮件日志:邮件日志记录了经过公司邮件服务器的收
8、发邮件信息。time 是邮件的发送时间/接收时间,proto 是邮件使用的应用协议。sip、dip 分别是连接发起者和接受者的 IP 地址,sport、dport 是与之对应的源与目的端口。from、to 分别是邮件的发送者和接收者。邮件内容属于隐私,只提供邮件主题 subject。email.csv字段名称 字段含义 相关说明time 邮件发送/接收时间 邮件包头中的邮件发送/接收时间proto 应用协议 SMTPsip 源 IP IP 报头源 IP 地址sport 源端口 TCP 报头源应用端口dip 目的 IP IP 报头目的 IP 地址dport 目的端口 TCP 报头目的应用端口fr
9、om 邮件发送人 来自于邮件头相应字段ChinaVis 2018 数据可视分析挑战赛 挑战 1 评审指南第 4 页to 邮件接收人 来自于邮件头相应字段subject 主题 来自于邮件头相应字段打卡日志:记录了公司每个员工每天上下班时间,一行记录中 checkin 或者 checkout 都为0,表示没来上班。那就是说,没有来公司打卡的员工,也有一行考勤记录。另外,如果公司员工当天没来公司上班,则次日该员工会收到旷工提醒邮件。checking.csv字段名称 字段含义 相关说明id 员工 idday 日期checkin 上班签到时间checkout 下班签退时间ChinaVis 2018 数据
10、可视分析挑战赛 挑战 1 评审指南第 5 页四、事件真相4.1 事件简表事件简称 重要程度 发生时间 事件概要Playing ball 1 一般 2017-11-02 19 点 员工集体参加打球活动Abnormal login 1 非常重要 2017-11-03 登录记录中某账号频繁登录失败Abnormal login 2 非常重要 2017-11-04 登录记录中某账号频繁登录失败Abnormal login 3 非常重要 2017-11-06 登录记录中某账号频繁登录失败,后面再没有出现类似事件Playing ball 2 一般 2017-11-09 19 点 员工集体参加打球活动Play
11、ing ball 3 一般 2017-11-16 19 点 员工集体参加打球活动Database failure 重要 2017-11-16 19:22 数据库由于员工误操作发生故障Database maintenance 重要 2017-11-16 19 点23 点 数据库故障后的临时维护Snooping product information 重要 2017-11-16 20:22员工在服务器上违规查看产品信息Playing ball 4 一般 2017-11-23 19 点 员工集体参加打球活动Data leakage 非常重要 2017-11-24 12:4312:44 员工盗取数据并
12、向外泄露Travel planning 一般 2017-11-27 至 2017-11-30 员工请假旅游Dimission 重要 2017-11-27 至 2017-11-28 员工申请辞职Playing ball 5 一般 2017-11-30 19 点 员工集体参加打球活动Financial department overtime 一般2017-11-19、2017-11-25、2017-11-26 月底的周末财务部门多次加班Stepping stone event 重要2017-11-17、2017-11-21、2017-11-27、2017-11-30员工通过跳板机向外界服务器上传数
13、据VPN remote access 一般2017-11-04、2017-11-052017-11-11、2017-11-122017-11-18、2017-11-192017-11-25、2017-11-26、2017-11-28员工没来公司,通过 VPN 远程链接到公司内网进行工作TCPLog system failure 一般 2017-11-10 至 2017-11-28TCP 流量监控系统可能存在bug,导致 TCP 日志数据中部分邮件收发记录的网络协议类型为http,而邮件日志数据中对应记录的协议类型为 smtpChinaVis 2018 数据可视分析挑战赛 挑战 1 评审指南第
14、6 页4.2 重要人物人物简称 员工 id 部门 IP 参与事件Thief 1487 研发 3 10.64.105.4Playing ball 3,Database maintenance,Snooping product information,Data leakage,DimissionLeader1 1080 研发 3 10.64.105.175 Abnormal login 1Leader2 1211 研发 3 10.64.105.63 Abnormal login 2Leader3 1228 研发 3 10.64.105.146 Abnormal login 3DB deleter
15、1376 研发 3 10.64.105.219 Playing ball 3,Database failure,Database maintenance,DimissionDB maintainer 1284 研发 3 10.64.105.95 Database maintenanceJob leaver 1281 研发 2 10.64.105.44 DimissionTraveler1 1149 人力资源 10.64.106.11 Travel planningTraveler2 1352 研发 3 10.64.105.174 Travel planningTraveler3 1383 研发
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 可视 分析 挑战赛 挑战 参考答案
限制150内