手机浏览器扫描二维码访问
““互联网+”
医疗健康的应用与发展研究(..)”
!
第二节
核心技术
一、技术起源
1.Google的三驾马车
Google在2003年到2004年公布了关于GFS、MapReduce和BigTable三篇技术论文,这三项技术成为后来云计算和大数据发展的重要基石,它们也被业界称为Google的三驾马车:
GFS(Google文件系统)是一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。
它运行于廉价的普通硬件上,并且提供容错功能。
MapReduce是一个编程模型,MapReduce架构的程序能够在大量普通配置的计算机上实现并行化处理。
Bigtable是一个分布式的结构化数据存储系统,被用来处理海量数据,这些数据通常是分布在数千台普通服务器上的PB级的数据。
2.Hadoop
从2005年开始至今,Yahoo资助的Hadoop团队按照Google公布的GFS、MapReduce和BigTable这三篇论文分别实现了它们的开源版本:HDFS(Hadoop分布式文件系统)对应GFS、HadoopMapReduce对应GoogleMapReduce、HBase对应GoogleBigtable。
经过几年发展,目前Hadoop已经成为Apache开源组织的独立项目,并形成了由许多子项目组成的Hadoop族群。
随着各个领域数据量的迅速增长,存储和处理大规模数据已成为迫切需求。
Hadoop作为目前大数据处理的主流标准和关键平台,引起了学术界和企业的普遍兴趣。
在学术界,Hadoop得到了各科研院所的广泛关注,许多著名的大学都加入到Hadoop集群的研究中来。
在商业界,IBM、Oracle、华为、百度、淘宝等大公司也都有独立的团队开展Hadoop平台的应用及产品化。
二、技术框架
从数据管理和处理的生命周期来划分,大数据的管理和处理体系可以自下而上大致分为四层:数据存储层、数据处理层、数据整合层和数据挖掘层,如图5-1所示。
图5-1大数据的数据管理和处理体系
三、关键技术
1.大数据存储技术
大数据的出现以及结构数据的改变使常规技术的数据存储和管理面临新的挑战。
在大数据环境下,存储解决方案主要包括分布式文件系统和数据库。
(1)分布式文件系统:
Google的GFS以及Hadoop族群中的HDFS都属于分布式文件系统,它们所管理的数据存储在分散的物理设备或节点上,存储资源通过网络连接。
(2)数据库:
目前,数据库系统主要的类型有满足传统信息化系统的数据规模的关系型数据库、满足计算机集群并行处理要求的非关系型(NoSQL)数据库以及满足医疗场景中实时性要求较高的实时数据库。
强盛的大唐,遭遇了一场突如其来的安史之乱,所有的繁华戛然而止。本书以安史之乱为背景,把人物和故事情节融合在波澜壮阔的历史画卷中,主人公都是有血有肉的普通人,没有逆天的神功和法宝,也没有繁琐的练级,却有催人泪下的爱情故事,更有对天道人性的感悟。历史上有名的经典战役,雍丘之战,潼关之战,睢阳守卫战,太原保卫战等都将在书中一一展示。传承儒道文化,弘扬国家民族大义。本书原名雪夜长明,...
小农民混花都!会符篆!会咒语!会医术!会一切!透视咒!隐身咒!定身咒!穿墙咒!撒豆成兵!纸人术!...
作者绿水绕青山的经典小说骨头们想种田最新章节全文阅读服务本站更新及时无弹窗广告小说骨头们想种田一万年前终焉降临,日月无踪,生机死绝。但是生命何等顽强,它以另一种形式顽强的存活下来,骷髅,灵体,晶化,植魂他们顽强的经受着一次又一次绝望的轮回。死而复生,生而复死,带着执念抵御着终焉灾厄。一万年后,一个异世来客被剥皮去肉,经历无尽苦难越过那片白骨化沙之地终焉沙海进入他们的世界。且看这个异世骨头踏着漫漫骨沙,重刻这日月星辰星辰(本文前慢热,看无脑爽的请走别家,看书群914259...
有着家传玄功的刘泽意外的偷看到嫂子张玉香洗澡,本来宁静的生活却好像随着这一抹粉色变得暧昧起来妖娆多姿的少妇,风情万种的寡妇以及楚楚可怜的小萝莉似乎都和刘泽有着许多不可告人的秘密...
你确定要结婚?她看了眼裸着上身的他,猛烈点头。这是最后一次陪你,从今以后我们没有什么关系!这下知道我的金箍棒不短了吧?你混蛋!...
邀请平时跟一座冰山似的总裁大人参加自己的订婚典礼,结果在自家上司的见证下,她华丽丽地被甩了。为了补偿总裁特意翘班又没有吃上酒席,章明曦被逼邀请公子大人共进午餐。然后,在餐厅,她眼睁睁地看着高冷的总裁大人被人甩掉。呵呵,他们真是一对同病相怜的好搭档。然而,总裁大人居然表示要从工作搭档进展为生活搭档。这,她白天在公司被他使唤来使唤去的已经够了好吗?还想骗她回到家里继续被他使唤?别说门没有,连窗都没有!...