手机浏览器扫描二维码访问
““互联网+”
医疗健康的应用与发展研究(..)”
!
第二节
核心技术
一、技术起源
1.Google的三驾马车
Google在2003年到2004年公布了关于GFS、MapReduce和BigTable三篇技术论文,这三项技术成为后来云计算和大数据发展的重要基石,它们也被业界称为Google的三驾马车:
GFS(Google文件系统)是一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。
它运行于廉价的普通硬件上,并且提供容错功能。
MapReduce是一个编程模型,MapReduce架构的程序能够在大量普通配置的计算机上实现并行化处理。
Bigtable是一个分布式的结构化数据存储系统,被用来处理海量数据,这些数据通常是分布在数千台普通服务器上的PB级的数据。
2.Hadoop
从2005年开始至今,Yahoo资助的Hadoop团队按照Google公布的GFS、MapReduce和BigTable这三篇论文分别实现了它们的开源版本:HDFS(Hadoop分布式文件系统)对应GFS、HadoopMapReduce对应GoogleMapReduce、HBase对应GoogleBigtable。
经过几年发展,目前Hadoop已经成为Apache开源组织的独立项目,并形成了由许多子项目组成的Hadoop族群。
随着各个领域数据量的迅速增长,存储和处理大规模数据已成为迫切需求。
Hadoop作为目前大数据处理的主流标准和关键平台,引起了学术界和企业的普遍兴趣。
在学术界,Hadoop得到了各科研院所的广泛关注,许多著名的大学都加入到Hadoop集群的研究中来。
在商业界,IBM、Oracle、华为、百度、淘宝等大公司也都有独立的团队开展Hadoop平台的应用及产品化。
二、技术框架
从数据管理和处理的生命周期来划分,大数据的管理和处理体系可以自下而上大致分为四层:数据存储层、数据处理层、数据整合层和数据挖掘层,如图5-1所示。
图5-1大数据的数据管理和处理体系
三、关键技术
1.大数据存储技术
大数据的出现以及结构数据的改变使常规技术的数据存储和管理面临新的挑战。
在大数据环境下,存储解决方案主要包括分布式文件系统和数据库。
(1)分布式文件系统:
Google的GFS以及Hadoop族群中的HDFS都属于分布式文件系统,它们所管理的数据存储在分散的物理设备或节点上,存储资源通过网络连接。
(2)数据库:
目前,数据库系统主要的类型有满足传统信息化系统的数据规模的关系型数据库、满足计算机集群并行处理要求的非关系型(NoSQL)数据库以及满足医疗场景中实时性要求较高的实时数据库。
作为一个新世界的好青年,我没想到自己竟会被一块口香糖噎死,更不会想到会重生在斗罗大陆。然而在我兴致勃勃的准备一展身手的时候,缺发现一个惨不忍睹的事实,我的武魂竟是口香糖!...
作为跨国集团的总裁,黄金单身汉,经常有人给他送女人。这个胆大包天的丫头竟然送男人,这是在怀疑他的性取向吗?他气愤不已地把男人丢了出去,把她拽了进来,他要向她证明,他到底喜欢男人还是女人!...
...
男友的背叛,小三的陷害,让她一夜之间掉落深渊身陷囹圄。原以为不过是一场你情我愿的交易,却在一场场阴谋和误会中被伤的体无完肤既然这世上没有人能相信,她能依靠的只有自己,那不如冷了心封了情,再不招惹这一切。只是当她下定决心睥睨一切时,那个冷清矜贵的男人却将她揽进怀里,霸道而缠绵别忘了你的身份,祈太太...
作者晋十三的经典小说穿成开国皇帝的恶毒原配最新章节全文阅读服务本站更新及时无弹窗广告小说熬夜猝死,魂穿小说男主的恶毒原配。她可不要重蹈炮灰覆辙,被渣爹活活弄死!为了活命,她立志牢牢抱紧男主的大腿。男主缺钱。她来挣!男主缺人脉。她来找!男主被窝缺老婆。她来上!嗯?等等,好像有哪里不对劲!...
刚入行的保险经纪人王笑,在一次意外事件中拥有了死神之眼的异能,不但可以准确地预见某人的死亡,还可以看出别人身上有什么病,何年何月会得某种大病。从此,他不再只是一名保险推销员,还是一名广告狂人教育奇才医疗达人娱乐至尊保险帝国的缔造者更是一名独一无二的死神代理人。嗨!我叫王笑,我是死神代理人,想跟你谈一笔生死攸关的生意,你有兴趣吗?...