电子政务邮件取证分析技术研究.docx
《电子政务邮件取证分析技术研究.docx》由会员分享,可在线阅读,更多相关《电子政务邮件取证分析技术研究.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、电子政务邮件取证分析技术研究 【摘要】电子邮件系统已经成为我国电子政务中信息交换的重要载体,如何准确、快速地对电子政务邮件系统中敏感邮件的扩散进行追踪溯源,已经成为当前核查工作的重点。本文针对电子政务系统邮件取证中用户关系挖掘困难的问题,基于Louvain算法对电子政务邮件网络中潜在的社区进行发现并与邮件数据分析相结合,挖掘出邮件网络内部的人物关系网络并对邮件网络进行可视化分析,可支撑电子政务邮件取证工作的开展。 【关键词】邮件取证;关系挖掘;可视化分析;扩散追踪 1引言 随着计算机技术和互联网的高速发展,电子邮件在多个行业特别是电子政务系统中得到广泛使用。电子邮件在便利人们生活的同时,也被犯
2、罪分子所利用,使用电子邮件进行垃圾邮件传播等活动,这些行为可能使受害者遭受严重损失。为了打击电子政务系统中的邮件犯罪行为,必须依靠电子邮件取证技术1。传统的电子邮件取证过程一般包括原始数据的获取、邮件相关数据提取、邮件恢复、文件转换和信息提取、查询和关键字查找、得出相关结论等6个步骤,取证人员通过关键字查找的方式挖掘邮件之间可能存在的联系,从人物、事件、时间3个维度对邮件数据进行分析,最终得出案件相关人员之间的人物关系网络、事件关系网络等。在小数据集的情况下,这种传统的关键字查找方式较为适用,但是当需要取证的邮件数据庞大、相关人员关系复杂时,一次关键字查找将会获得大量冗余结果,获取人员之间的人
3、物关系网络将会变得极为困难,不仅消耗大量的资源,分析结果也往往不尽如人意。在这种现状下,本文对邮件取证中的人物关系网络挖掘进行了研究和改进。本文使用Louvain算法对邮件网络中的潜在社区进行发现,结合对特定邮件传播轨迹的可视化,分析比较特定邮件在邮件用户社区中的传播情况和扩散范围,通过对扩散范围和社区边界的比对来发现邮件系统存在的其他有害邮件,挖掘出邮件网络内部的人物关系网络。从计算学的观点来看,社交关系挖掘的研究主要包括3个方面2:关系链接预测,即预测和推荐未知的链接,如Liben-Nowell和Kleinberg3系统地研究了推断用户之间新链接的问题;关系类型预测,即自动地识别与每一个社
4、交关系相关联的语义,如Leskovec4等人使用Logistic回归模型预测在线社交网络中的正/负关系,Diehl5等人通过学习排序函数识别“经理下属”关系等;关系交互预测,即研究单向的社交关系怎样发展成双向的社交关系及其产生的原因,如Lou6等人研究了社交关系如何发展成三元闭包等。从这类角度来看,本文对人物关系网络的研究属于关系挖掘研究中的关系链接预测,即预测和推荐未知的链接(发现邮件系统存在的其他有害邮件);相比于传统的关键字查找方式,这种方法结合了邮件社区划分和邮件扩散可视化,大大减少了取证人员的工作量,更加直观地展示了邮件用户之间的关系,更准确地挖掘出人物关系网络,从而提高了电子邮件取
5、证工作的质量和效率。实验证明,本文提出的方法在追踪特定邮件附件扩散范围的场景下应用效果良好。 2邮件取证 电子邮件取证的原始数据一般来自多个数据源,包括发件人或收件人使用的终端、邮件传递服务器上的存储介质等,如果是Web端邮件则需要检查用户浏览器的相关信息,如缓存、日志等。这些数据较为原始,提取需要较强的专业知识且一般不能直接理解,同时这些数据一般包含着大量的无关信息,需要进一步筛选;获取原始数据后,需要使用一定的技术手段来获取与邮件证据相关的数据,这一步直接决定了之后要处理数据的规模和质量,因而是整个电子邮件取证过程中较为关键的一步;通过上一步的筛选,得到所有与邮件相关的数据,但是这些数据仍
6、然处于取证人员很难理解的形式,需要进行数据恢复和格式重组来得到可读性更高的原始邮件内容;根据重组后的邮件格式进行文件转换及信息提取后,可以将邮件内容转化为可以直接阅读的文本、图片等形式;到了这一步,邮件数据已经完全可读,此时根据传统的办法对所有邮件数据进行关键字查找等处理,进而得出人物关系网络、事件关系网络等,以及得出有效的电子证据;分析完成后,根据确定的关系网络、电子证据等对案件的过程进行还原,从时间、事件、人物3个维度对原始场景进行构建并得出最终结论。在查询和关键字查找步骤中,已经获得了所有与案件相关且直接可读的邮件数据,此时传统的方法会对所有邮件数据进行关键字查找等分析处理,进而挖掘出人
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电子政务 邮件 取证 分析 技术研究
限制150内