《大数据架构详解》读后感800字
最近,再次认真阅读了朱洁、罗华霖编著的《大数据架构详解》这本书的2016年版,感觉收获颇多。伴随着互联网产业以及以云计算为代表的计算、存储和通信技术的蓬勃发展,大数据应时、应势而来。其架构纷繁复杂,其以hadoop为代表的技术生态也是越来越庞大。《大数据架构详解》这本书抽丝剥茧,着重从架构的角度对大数据进行了清晰的阐述。
该书全面、系统的同时很接地气:既结合具体业务场景(运营商的运维质量管理、客户体验提升、市场运维支撑、数据管理平台等),又结合具体技术实战(Hive、Stom、Spark、Flume、Kafka、YARN、Shuffle、MapReduce等,机器学习、深度学习、GPU计算等)。很认同书中阐述的观点——“大数据是一种问题解决思路,是一系列技术的集合”。架构最终是服务于业务的,而大数据就是解决业务问题的一个重要思路。以前技术条件不具备(如计算和网络传输速度、存储能力等),现在技术上能够落地了。这个落地需要一组技术的支撑,而大数据架构系统地提供了相对完备、且在日益丰富的技术工具集(覆盖数据获取、存储、处理、技术、交互式分析、机器学习等)。
此外,该书重点对“大数据云化”进行了讨论。以虚拟化为基础、软件定义资源为主要特征的云计算,已经成为当前最重要的IT基础设施之一。大数据上云既是必然也是必须。针对集群模式和服务模式两种大数据云服务的模式,书中分别进行了讨论,对理解大数据的实施、部署规划很有帮助。
《大数据架构详解》一书中,也对整体同步并行计算模型(Bulk Synchronous Parallel Computing Model,简称BSP模型)从基本原理、特点以及实现等进行了全面分析,并于MapReduce进行了对比。并行计算核心目标是为了更快、更强的算力,而大数据与BSP的融合也是大数据进一步发展的重要趋势。该书还从开发文化的高度展望了大数据的未来发展,并提出了开发与运维组合的观点(DevOps理念),(www.gushidaquan.com.cn)最后着重强调了速度的重要性。一切应对措施如果不能在一定时限内完成将失去实质意义,更快分析过去、更快研判现在、更快拥抱未来(变化)将是大数据架构不断演进的重要目标。
该书从业务到技术,从技术到文化,对大数据架构进行了系统、全面、详实的讨论,并且深入浅出、容易理解。很推荐大数据从业者和关注大数据发展的朋友们阅读、学习。作者:宇尘埃