欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    Hbase+ES和MongoDB存储大数据的选用.docx

    • 资源ID:73274729       资源大小:17.42KB        全文页数:4页
    • 资源格式: DOCX        下载积分:14.8金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要14.8金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    Hbase+ES和MongoDB存储大数据的选用.docx

    Hbase+ES和MongoDB存储大数据的选用 1 需求 解决海量数据的存储 并且可以实现海量数据的秒级查询 Hbase是典型的nosql 是一种构建在HDFS之上的分布式、面向列的存储系统 在需要的时候可以进展实时的大规模数据集的读写操作 但是hbase的语法非常固话 即便在hbase之上嫁接了phoneix在应对复杂查询的时候 仍然力不从心 这里只讲是大公司 小公司一个HBASE绝对够用 所以讲很多公司在历史遗留问题 最开场数据存储在hbase上 当业务越来越复杂 数据量越来越大的时候 使用hbase构建复杂的查询就很吃力了 甚至很多指标无法完成 这个时候 我们就是用elasticsearch架构在hbase之上 海量的数据存储使用hbase 数据的即席查询 快速检索 使用elasticsearch 通过elasticsearch hbase就可以做到海量数据的复杂查询 在操作之前 我们还要考虑 一批数据在elasticsearch中构建索引的时候 针对每一个字段要分析是否存储以及是否构建索引 ES Hbase的话,公司的使用是将ES的索引就行以及实体类就行一个索引映射,然后用一个封装好的效劳之后推入索引库中数据,详细还没研究不是很清楚,这种框架类的东西会用就行了,问题也不大,因为以前写的话,是自己从数据库查询数据做一个批量导入,应该原理上是一样的,之后就是通过es的索引支持然后查询Hbase,这里我想应该是es充当hbase的索引进展查询,我们以前的是用的mongodb是支持10亿级别数据再往上就不行了,hbase支持百亿数据,这里hbase并且可以实现海量数据的秒级查询,我查询了一下hbase的语法非常固话 即便在hbase之上嫁接了phoneix在应对复杂查询的时候 仍然力不从心,当业务越来越复杂 数据量越来越大的时候 使用hbase构建复杂的查询就很吃力了 甚至很多指标无法完成,所以这个es起了关键性因素 实际应用 先ES根据条件查询到分页数据 或是list里面封装的是那个所有实体类、然后遍历 通过遍历到的id去查hbase 之后就可以封装Dto 然后返回List 2 架构设计 3 HBase以及MongoDB的区别 Mongodb用于存储非构造化数据 尤其擅长存储json格式的数据或是一些很难建索引的文本数据,。存储的量大概在10亿级别 再往上性能就下降了 除非另外分库。 Hbase是架构在hdfs上的列式存储 擅长rowkey的快速查询 但模糊匹配查询 其实是前模糊或者全模糊 不擅长 但存储的量可以到达百亿甚至以上 比mongodb的存储量大多了。 原因就在于写入的速度 hbase由于只维护一个主键 写入的速度要比mongodb这种要维护所有索引的数据库快多了。hbase占用两台机器能完成的事情 mongodb要占用更多的机器 每台机器按一年度20000的费用 几百台下来就是一笔很大的费用。但是代价就是hbase记录下东西以后 只能事后通过全表检索或者按照索引范围的方式进展整体分析 而不能对详细每个人的数据进展实时分析 更强调数据分析才能而不是实时数据查询才能 因此各有千秋吧。像用户行为分析的这种 一开场产品经理可能会详细看某一个人的数据 但是新颖过后 只会看程序的分析结果了。因此从经济的角度出发 对于用户行为分析这种不需要实时数据的需求来讲 hbase mysql就可以用最经济的方式解决了。mongodb比拟合适需要实时返回数据的大数据应用。 总结 MongoDB更像传统的关系型数据库 更擅长做查询。Hbase更偏向非关系型数据库 扩展储存才能强. Mysql数据量增加到千万的时候 响应时间上升很多以及吞吐量下降很多。需要分表或分片。 1 从平均响应时间来看 mongodb占据绝对优势。 2 从吞吐量上来看 mongodb占据绝对优势。 3 对于千万或更大的数据量 应该是要分区或者分片 同时考虑分区容错性。如下列图 mongodb属于CP 同时知足一致性(C Consistency)、分区容错性(P Partition Tolerance)。MySQL属于CA 同时知足一致性(C Consistency)、可用性 A Availability 。 其实后期很多公司都不选用Mongodb因为一旦数据量过大 再去改构造很复杂 京东已经做了交换

    注意事项

    本文(Hbase+ES和MongoDB存储大数据的选用.docx)为本站会员(安***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开