欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    2021年机器学习大作业机器学习在乳腺癌分类上应用.pdf

    • 资源ID:75980000       资源大小:154.29KB        全文页数:6页
    • 资源格式: PDF        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2021年机器学习大作业机器学习在乳腺癌分类上应用.pdf

    机器学习大作业机器学习在乳腺癌分类上应用机器学习大作业机器学习在乳腺癌分类上应用软件学院 综合实 验 报 告 实验课程 数据分析综合实验 开课时间 20XX 至 2020 学年 第 2 学期 年 级 xx 专业班 5 班 姓 名王帅兵 学 号 xx7710541 总 成 绩 教师签名 软件学院制机器学习在乳腺癌分类上的应用 1.选题依据 机器学习是人工智能领域及其重要的分支,随着技术的不断革新其在医疗方面的应用也日趋广泛和深入。本文针对当前人眼判别的不稳定性和经验上的不足问题,提出运用机器学习的方法,通过对乳腺癌各种属性数据进行训练,让乳腺癌诊断系统可以自动诊断出恶性乳腺癌患者,减少人的操作存在时间和经验上的影响。2.背景 乳腺癌是女性最常见的癌症,也是中国女性癌症死亡的首要原因。虽然乳腺癌是女性癌症死亡的主要原因,但其生存能力很高。早期诊断治疗后女性乳腺癌 5 年生存率达到 97%。尽管早期发现乳腺癌是可以治愈的,但大约三分之一的女性乳腺癌患者仍死于该疾病。然而,尽管早期发现和选择新的治疗方法,多达50%的女性依然会发生转移,目前由于尚未确定乳腺癌的原因,精确的早期发现对于降低死亡率至关重要。而且,乳腺癌的患病人群也越来越年轻化。因此,乳腺癌的诊断与治疗已经成为医学研究的重中之重。乳腺癌影响因素多样,如何提高乳腺癌的诊断效率已经成为急需解决的问题。针对上述情况,我们将使用 UCI 机器学习数据库中的乳腺癌威斯康星州数据集作为研究对象,分别采用逻辑回归算法,K-近邻算法,支持向量机,贝叶斯分类器,决策树及随机森林建立乳腺癌诊断分类器,并对研究结果进行对比分析,找到最优分类器。经过对分类器的参数进行网格搜索,进一步提高了分类器的分类性能。实验结果发现 KNN 的表现优异,准确率高达 97.37%。该应用有助于帮助医生对病情进行更加精准的诊断。3.题目分析 1 3.1 数据:UCI 公开数据集-Breast Can _r Wisconsin,属 _如下:1)ID number(患者 ID 编号,无实际意义,实际测试时候可以省去不用)2)Diagnosis(M=_lignant,B=benign)3-32)Ten real-valued features are puted for each _ll nucleus:a)radius(mean of distan _s from _nter to points onthe perimeter)b)texture(standard deviation of gray-scalevalues)c)perimeter d)area e)_oothness(localvariation in radius lengths)f)pactness(perimeter2/area-1.0)g)concavity(severity of concave portions ofthe contour)h)concave points(number of concave portionsof the contour)i)symmetry j)fractal dimension(coastline approxi _tion-1)2 3.2 数据格式:序数属性,数值属性,标称属性。3 3.3 合适的算法类型:选择分类算法预测乳腺癌。分类是在一群已经知道类别标号的样本中,训练一种分类器,让其能够对某种的样本进行分类。分类算法属于一种有监督的学习。分类算法的分类过程就是建立一种分类模型来描述预定的数据集或概念集,通过分析由属性描述的数据库元组来构造模型。分类的目的就是使用分类对新的数据集进行划分,其主要涉及分类规则的准确性、过拟合、矛盾划分的取舍等。4.实验过程 1 4.1 数据探索和可视化 良性和恶性肿瘤比率 恶行肿瘤患者和良性肿瘤患者的各项平均指标部分特征分布 观察 radius_mean-texture_mean-患病三者关系热力图分析属性相关性主成分分析 4.2 2 数据预处理:4.3 3 算法选择:选择六种经典的分类算法:逻辑回归算法 K 近邻算法 支持向量机 贝叶斯分类器 决策树 随机森林 4.4 4 算法调优:主要使用网格调参 逻辑回归算法 K K 近邻算法支持向量机 贝叶斯分类决策树随机森林 5.结果分析 六种模型准确率的直方图混淆矩阵 N KNN 算法精度和召回率变化曲线 N KNN 的 的 CROC 曲线 C ROC 的 _ N KNN 算法不同 K K 取值的准确度通过对六种模型网格调参后的比较,可以看出 KNN 算法在 k 取值 7-15 时的分类准确率最高,为 97.37%,其 ROC _达到0.996。6.结论 本文采用真实的乳腺癌数据样本,构建出逻辑回归、SVM、决策树、贝叶斯、KNN、随机森林六种经典机器学习模型对样本进行训练。实施的实验结果明确,经过对六种算法进行建立模型以及网格搜索参数优化,得到的诊断分类器中 K 近邻算法性能最优,具有明显的优势。其分类准确率为 97.37%,而贝叶斯、决策树分类器经过网格搜索优化参数后,分类准确率均不超过 95%。而使用网格搜索对K 近邻算法进行参数优化后,其 ROC _达到 0.996。依据本实验结论,可将 KNN 分类器运用于生产实践中。借助现有医疗手段测定人体九种医学指标数值,将各测定的属性数值输入到分类器中,便可以快速的诊断出该患者是否患有恶性乳腺癌。也许可以辅助医生提高诊断的准确率和效率,帮助更多的人早发现早治疗。模板,内容仅供参考

    注意事项

    本文(2021年机器学习大作业机器学习在乳腺癌分类上应用.pdf)为本站会员(修****)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开