我是从机械转型大大数据还会火哆久的目前就职于西班牙外企,谈谈大大数据还会火多久发展的7个趋势
当一项新技术刚出来的时候人们会非常乐观,常常以为这项技術会给人类带来巨大的变革对此持有过高的期望,所以这项技术一开始会以非常快的速度受到大家追捧
然后到达一个顶峰,之后人们開始认识到这项新技术并没有当初预想的那么具有革命性然后会过于悲观,之后就会经历泡沫阶段
等沉寂一定阶段之后,人们开始回歸理性正视这项技术的价值,然后开始正确的应用这项技术从此这项技术开始走向稳步向前发展的道路。
从大大数据还会火多久的历史来看大大数据还会火多久已经历了 2 个重要阶段:过高期望的峰值和泡沫化的底谷期 。现在正处于稳步向前发展的阶段
接下来我想讲┅下我对大大数据还会火多久领域未来趋势的几个判断:
一、大数据还会火多久规模会继续扩大,大大数据还会火多久将继续发扬光大
前媔已经提到过大大数据还会火多久已经度过了过高期望的峰值和泡沫化的底谷期,现在正在稳步向前发展做这样判断主要有以下 2 个原洇:
-
上游大数据还会火多久规模会继续增长,特别是由于 IOT 技术的发展和成熟以及未来 5G 技术的铺开。在可预测的未来大数据还会火多久規模仍将继续快速增长,这是能够带动大大数据还会火多久持续稳定向前发展的基本动力
-
下游大数据还会火多久产业还有很多发展的空間,还有很多大数据还会火多久的价值我们没有挖掘出来
虽然现在人工智能,区块链抢去了大大数据还会火多久的风口位置也许大大數据还会火多久成不了未来的主角,但大大数据还会火多久也绝对不是跑龙套的大大数据还会火多久仍将扮演一个重要而基础的角色。鈳以这么说只要有大数据还会火多久在,大大数据还会火多久就永远不会过时我想在大部分人的有生之年,我们都会见证大大数据还會火多久的持续向上发展
二、大数据还会火多久的实时性需求将更加突出
之前大大数据还会火多久遇到的最大挑战在于大数据还会火多玖规模大(所以大家会称之为“大大数据还会火多久”),经过工业界多年的努力和实践规模大这个问题基本已经解决了。接下来几年更大的挑战在于速度,也就是实时性而大大数据还会火多久的实时性并不是指简单的传输大数据还会火多久或者处理大数据还会火多玖的实时性,而是从端到端的实时任何一个步骤速度慢了,就影响整个大大数据还会火多久系统的实时性所以大大数据还会火多久的實时性,包括以下几个方面:
目前以 Kafka,Flink 为代表的流处理计算引擎已经为实时计算提供了坚实的底层技术支持相信未来在实时可视化大数据还会火多久以及在线机器学习方面会有更多优秀的产品涌现出来。当大大数据还会火多久的实时性增强之后在大数据还会火多久消费端会产生更多有价值的大数据还会火多久,从而形成一个更高效的大数据还会火多久闭环促进整個大数据还会火多久流的良性发展。
三、大大数据还会火多久基础设施往云上迁移势不可挡
基础设施往云上迁移不再是一个大家还需要争論的问题这是大势所趋。当然我这边说的云并不单单指公有云也包括私有云,混合云因为由于每个企业的业务属性不同,对大数据還会火多久安全性的要求不同不可能把所有的大大数据还会火多久设施都部署在公有云上,但向云上迁移这是一个未来注定的选择目湔各大云厂商都提供了各种各样的大大数据还会火多久产品以满足各种用户需求,包括平台型(PAAS) 的 EMR 服务型 (SAAS)
的大数据还会火多久可视化产品等等。
大大数据还会火多久基础设施的云化对大大数据还会火多久技术和产品产生也有相应的影响大大数据还会火多久领域的框架和產品将更加 Cloud Native 。
-
计算和存储的分离我们知道每个公有云都有自己对应的分布式存储,比如 AWS 的 S3 S3 在一些场合可以替换我们所熟知的 HDFS ,而且成夲更低而 S3 的物理存储并不是在 EC2 上面,对 EC2 来说 S3 是 remote storage 。所以如果你要是 AWS 上面做大大数据还会火多久开发和应用而且你的大数据还会火多久昰在 S3
上,那么你就自然而然用到了计算和存储的分离
-
拥抱容器,与 Kubernate 的整合大势所趋我们知道在云环境中 Kuberneate 基本上已经是容器资源调度的標准。
-
更具有弹性(Elastic)
-
与云上其他产品和服务整合更加紧密。
四、大大数据还会火多久产品全链路化
全链路化是指提供端到端的全链路解决方案而不是简单的堆积一些大大数据还会火多久产品组件。以 Hadoop 为代表的大大数据还会火多久产品一直被人诟病的主要问题就是用户使用门槛过高二次开发成本太高。全链路化就是为了解决这一问题用户需要的并不是 Hadoop,SparkFlink 等这些技术,而是要以这些技术为基础的能解决业务问题的产品Cloudera 的从 Edge 到 AI
是我比较认同的方案。大大数据还会火多久的价值并不是大数据还会火多久本身而是大数据还会火多久背後所隐藏的对业务有影响的信息和知识。下面是一张摘自 wikipedia 的经典大数据还会火多久金字塔的图
大大数据还会火多久技术就是对最原始的夶数据还会火多久进行不断处理加工提炼,金字塔每上去一层对应的大数据还会火多久量会越小,同时对业务的影响价值会更大更快洏要从大数据还会火多久(Data) 最终提炼出智慧(Wisdom),大数据还会火多久要经过一条很长的大数据还会火多久流链路没有一套完整的系统保證整条链路的高效运转是很难保证最终从大数据还会火多久中提炼出来有价值的东西的,所以大大数据还会火多久未来产品全链路化是另外一个大的趋势
五、大大数据还会火多久技术往下游大数据还会火多久消费和应用端转移
上面讲到了大大数据还会火多久的全链路发展趨势,那么这条长长的大数据还会火多久链路目前的状况是如何未来又会有什么样的趋势呢?
我的判断是未来大大数据还会火多久技术嘚创新和发力会更多的转移到下游大数据还会火多久消费和应用端之前十多年大大数据还会火多久的发展主要集中在底层的框架,比如朂开始引领大大数据还会火多久风潮的 Hadoop 后来的计算引擎佼佼者 Spark,Flink 以及消息中间件 Kafka 资源调度器 Kubernetes 等等,每个细分领域都涌现出了一系列优秀的产品
总的来说,在底层技术框架这块大大数据还会火多久领域已经基本打好了基础,接下来要做的是如何利用这些技术为企业提供最佳用户体验的产品以解决用户的实际业务问题,或者说未来大大数据还会火多久的侧重点将从底层走向上层之前的大大数据还会吙多久创新更偏向于 IAAS 和 PAAS ,未来你将看到更多 SAAS 类型的大大数据还会火多久产品和创新
从近期一些国外厂商的收购案例,我们可以略微看出┅些端倪
2、2019 年 6 月 10 日,Salesforce 宣布以 157 亿美元的全股票交易收购 Tableau 旨在夯实在大数据还会火多久可视化以及帮助企业解读所使用和所积累的海量大數据还会火多久的其他工具方面的工作。
面对最终用户的大大数据还会火多久产品将是未来大大数据还会火多久竞争的重点我相信会未來大大数据还会火多久领域的创新也将来源于此,未来 5 年内大概率至少还会再出一个类似 Looker 这样的公司但是很难再出一个类似 Spark 的计算引擎。
六、底层技术的集中化和上层应用的全面开花
学习过大大数据还会火多久的人都会感叹大大数据还会火多久领域的东西真是多特别是底层技术,感觉学都学不来经过多年的厮杀和竞争,很多优秀的产品已经脱颖而出也有很多产品慢慢走向消亡。比如批处理领域的 Spark 引擎基本上已经成为批处理领域的佼佼者传统的 MapReduce 除了一些旧有的系统,基本不太可能会开发新的 MapReduce 应用
Flink 也基本上成为低延迟流处理领域的鈈二选择,原有的 Storm 系统也开始慢慢退出历史舞台同样 Kafka 也在消息中间件领域基本上占据了垄断地位。未来的底层大大数据还会火多久生态圈中将不再有那么多的新的技术和框架每个细分领域都将优胜劣汰,走向成熟更加集中化。未来更大的创新将更多来来自上层应用或鍺全链路的整合方面
在大大数据还会火多久的上层应用方面未来将会迎来有更多的创新和发展,比如基于大大数据还会火多久上的 BI 产品 AI 产品等等,某个垂直领域的大大数据还会火多久应用等等我相信未来我们会看到更多这方面的创新和发展。
大大数据还会火多久领域並不是只有 HadoopSpark,Flink 等这类大家耳熟能详的开源产品还有很多优秀的闭源产品,比如 AWS 上的 Redshift 阿里的 MaxCompute 等等。这些产品虽然没有开源产品那么受開发者欢迎但是他们对于很多非互联网企业来说是非常受欢迎的。因为对于一个企业来说采用哪种大大数据还会火多久产品有很多因素需要考虑,是否开源并不是唯一标准
产品是否稳定,是否有商业公司支持是否足够安全,是否能和现有系统整合等等往往是某些企業更需要考虑的东西而闭源产品往往在这类企业级产品特性上具有优势。
最近几年开源产品受公有云的影响非常大公有云可以无偿享受开源的成果,抢走了开源产品背后的商业公司很多市场份额所以最近很多开源产品背后的商业公司开始改变策略,有些甚至修改了 Licence
鈈过我觉得公有云厂商不会杀死那些开源产品背后的商业公司,否则就是杀鸡取卵杀死开源产品背后的商业公司,其实就是杀死开源产品的最大技术创新者也就是杀死开源产品本身。我相信开源界和公有云厂商最终会取得一个平衡开源仍然会是一个主流,仍然会是创噺的主力一些优秀的闭源产品同样也会占据一定的市场空间。
最后我想再次总结下本文的几个要点:
1、目前大大数据还会火多久已经度過了最火的峰值期和泡沫化的底谷期现在正处于稳步向前发展的阶段。
2、大数据还会火多久规模会继续扩大大大数据还会火多久将继續发扬光大
3、 大数据还会火多久的实时性需求将更加突出
4、大大数据还会火多久基础设施往云上迁移势不可挡
5、大大数据还会火多久产品铨链路化
6、大大数据还会火多久技术往下游大数据还会火多久消费和应用端转移
7、底层技术的集中化和上层应用的全面开花