一种基于机器学习的入侵检测模型研究,计算机应用技术论文.docx
《一种基于机器学习的入侵检测模型研究,计算机应用技术论文.docx》由会员分享,可在线阅读,更多相关《一种基于机器学习的入侵检测模型研究,计算机应用技术论文.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一种基于机器学习的入侵检测模型研究,计算机应用技术论文本篇论文目录导航:【】【】【】【】【】 一种基于机器学习的入侵检测模型研究 机器学习论文范文:一种基于机器学习的入侵检测模型研究 内容摘要:本文针对网络流量数据规模较大、攻击与入侵样本分布不平衡等特点,提出了一种基于机器学习的入侵检测模型。该模型结合深度降噪自编码器与马氏距离差值算法,能够提取更为关键的特征,提高了神经网络进行入侵检测的性能。通过实验表示清楚,本文所提的两种方式方法在入侵检测任务中呈现出更高层次的准确性,与原始自编码器相比提高了8.1%. 本文关键词语:机器学习;入侵检测;自编码器; 作者简介:屈耘野1999-,男,浙江省台
2、州市人。大学本科在读。研究方向为计算机科学、数据科学与机器学习。;姜咏琪2002-,女,黑龙江省齐齐哈尔市人。大学本科在读。研究方向为深度学习、信息与计算科学。; 1 引言 网络攻击与入侵很可能会带来广泛的负面影响,包括数据损失、经济损失和多维度的安全威胁。网络攻击与入侵所导致的业务中断,很可能引发数据泄露,面临敲诈讹诈等威胁。对医疗系统的攻击,使非法入侵者获取关键信息,更是让医疗检测和器械的准确性大打折扣;无人驾驶系统中的攻击与入侵,更关乎每个公民的人身安全。 近年来,基于机器学习的检测技术在众多领域进行了应用。2021年,Litjens1等人调查了在医学领域使用机器学习技术的状况,十分是在
3、医学图像分类、目的检测、分割和其他任务中的应用。2021年,Mohammadi2等人提供了用于物联网大数据的机器学习算法与框架背景。Kiran3等人总结了应用于时空数据检测的机器学习模型,并研究了相关评估标。 这些应用的实际成果表示清楚,机器学习可能拥有超越传统算法的优势。本文提出通过数据噪音和马氏距离差值项改良最新深度自编码器Autoencoder,AE的方式方法,能够更为有效的进行高维流量降维与入侵检测,有助于弥补自编码器难以学习深层特性和克制数据损坏的缺点,并为日后希望实现或研究入侵检测技术的研究人员和工程师们提供经历体验与参考。 2 自编码神经网络算法 2.1 神经网络构造 自编码器的
4、构造分为编码器和解码器两部分。它将输入编码并降维,提取数据关键的特征,然后解码并重建原始的高维输入数据,使得解码后的数据与输入本身尽可能一致4. 本文中自动编码器使用分别具有42、24、12、12和42个神经元的5个全连接层。第一层是输入层,与数据原始输入的维度一致,与之后两层一同用于编码。最后两层用于解码,由于数据原始输入维度的要求,输出层的神经元个数与其一致。 华而不实编码部分每层之间分别使用双曲正切Tan H激活函数与整流线性单元Re LU激活函数。最后两层为解码层,同样使用Tan H激活函数与Re LU激活函数,能够更好地重构输入数据。 2.2 数据加噪 受整体构造复杂程度、数据集规模
5、和噪声损坏等因素限制,原始自编码器训练生成的神经网络过拟合可能性较高。考虑对输入数据参加噪音,使学习得到的编码器具有较强的稳定性,提高其泛化性能。本文噪音使用标准正态分布Standard Normal Distribution函数: 服从该概率分布的噪音将添加到输入数据的每一个值上: 华而不实函数Add_noise用于加噪,n_factor为噪音权重系数,xj 为加噪后的单个数据样本在该维度上的值。 2.3 马氏距离差值项 马氏距离Mahalanobis Distance是一种度量样本之间类似程度的距离指标,既考虑到了各种特性之间的相互联络又独立于测量尺度5. 设输入数据集的均值为: 且数据集
6、的协方差矩阵为 ,则其马氏距离表示为: 马氏距离计算经过中使用了数据集的均值,而均值会放大少量攻击入侵数据的影响6.因而本文采取不受攻击入侵数据变化影响的训练集正常数据均值 N和协方差矩阵 N,函数表示如下: 参加马氏距离差值项后改良的自编码器损失函数表示如下: 华而不实函数MSE是均方误差损失函数,m_factor为马氏距离差值项权重系数,MXi,Yi为马氏距离差值。 3 实验与结果 3.1 环境与数据集 本文实验使用Ubuntu18.04.5操作系统,计算机CPU为Intel Core i7-10750H,RAM容量为40GB,基于Keras框架使用Python3.6.9与Tensorfl
7、ow1.2.0底层实现;数据集使用基于KDD99数据集重采样的NSL-KDD数据集。 KDD99数据集源于美国国防部于1998年在马萨诸塞州林肯实验室MIT Lincoln Laboratory进行的一项网络攻击与入侵实验7.华而不实训练集已经完成超过20种攻击入侵行为的标记,测试集中则包含了10余种未曾出现的新型入侵。KDD99数据集在第五届知识发现与数据挖掘国际会议发布,之后在事实上成为了网络攻击与入侵领域检验模型效果的测试工具。 NSL-KDD数据集对KDD99数据集进行了重采样8.华而不实带标记的训练集与测试集均为41个维度。本次实验根据需要对相关标签进行了映射与转换,并排除了部分未知
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文化交流
限制150内