大数据的几本书

作者: 这事情急不得 | 来源:发表于2019-03-25 11:21 被阅读47次

本年度第 22/100篇。

我其实对大数据完全不熟,但也硬着头皮看了这本书:

此书主要讲了流式系统和传统表系统的区别,从理论上论证了流式系统是表系统的超集。同时又讲了可以用流式系统来完全取代批处理系统,这样lambda架构也不需要了。但此书作者假设你是一个大数据领域的从业者,所以前面几章我完全不是很懂,后面又谈到了如何设计流式系统的SQL语言,我没用过大数据所以也是看的一知半解。

但至少这本书想讲的意思我差不多了解了,每章最后的summary是很不错的东西,作者对于stream和table的定义和思考也是标新立异,很有趣。全书有点啰嗦,但不失为一本讲理论的奇书。

我原来看过lambda架构,就是下面这本书,本来以为lambda架构是一个很好的架构,谁知道上面这本书认为完全不需要lambda架构,一个好的流式系统可以取代一切。

接下来这本,这本更是神作中的神作:

这本综述了各种数据库系统的区别,非常详尽的阐述了各种不同的数据库系统的设计原理,非常多的实现细节,相关技术方案讨论,可谓包罗万象,我为作者的学识的渊博所深深的折服。最厉害最精彩的应该是对distributed的各种transaction和各种锁的实现的讨论和对比,以及对于CAP的正确的诠释。绝对是一部大部头,强烈推荐英文原版,有时间可能需要二刷三刷不然内容实在太多,我现在已经看了以后全忘记了。。。

最后,还有一本讲log系统的设计的,可能和kafka有直接的关系,只有短短60页,我刚下载好还没看:

相关文章

  • 大数据的几本书

    本年度第22/100篇。 我其实对大数据完全不熟,但也硬着头皮看了这本书: 此书主要讲了流式系统和传统表系统的区别...

  • 关于数据分析的几本书

    对于数据分析的书,博主推荐几本,只做参考。 1、统计会犯错——如何避免数据分析中的统计陷阱 【一本值得珍藏、大胆迷...

  • 买了几本书,又借了一大摞书。开启阅读模式。。

  • 书单来了(一)

    今天给大家推荐几本书,顺便介绍一下这几本书的作者 1、佐藤大的《由内向外看世界》、《用设计解决问题》 2、佐藤可士...

  • 2023-01-18完成才是硬道理

    昨天整理电子书架的时候,对其中几本书纠结了很久,最后决定先保留,结果就是书架上书比预期多。这几本书,都是已经读完大...

  • 数据大屏 - guandata智能数据可视化分析

    数据大屏可视化可更直观更智能的决策场景体验,通过数据大屏实时监测企业数据,洞悉运营增长,助力智能高效决策。 数据大...

  • 大数据是什么

    一、大数据概念 "大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对...

  • 也谈谈读书(一)

    今年有幸聆听几次大领导的讲话,大领导提到要多阅读,而且,领导也提到大领导每次出差,行李箱里面都会塞几本书。偶尔几次...

  • hadoop框架学习笔记一 2020-04-01

    1.1大数据概论 主要解决海量数据存储和海量数据的分析计算问题 1.2大数据的特点 * volume(大量) *v...

  • 九月学习生活流水账

    【没有任何借口,只列行动数据,加强自我监督,自律使我自由】 本月概况:上了几堂课,读了几本书,聚了几次会,游了几个...

网友评论

    本文标题:大数据的几本书

    本文链接:https://www.haomeiwen.com/subject/mphvvqtx.html