大数据与云计算之间的区别与联系

 

  在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中提出:大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。

  那么究竟多大的数据算是大数据,这个其实并没有明确的定义。不过IBM提出了大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。这也是目前大家比较公认的大数据的特征。

  这个5V的特点,反映了大数据数据量大、产生的速度快且多样,同时大数据具有低价值密度的特点,同时大数据也可能会夹杂一些干扰,影响数据的真实性。因此需要一些技术手段能够快速处理海量数据,并且能够从大数据中挖掘有价值的信息。

  (1)内容数据。Web2.0时代以后,每个人都成为了媒体,都在网络上生产内容,包括文字、图片、视频等等。

  (2)电商数据。随着电子商务的发展,线上交易量已经占据整个零售业交易的大部分。每一笔交易都包含了买家、卖家以及商品背后的整条价值链条的信息。

  (3)社交数据。随着移动社交成为最主要的社交方式,社交不仅仅只有人与人之间的交流作用,社交数据中包括了人的喜好、生活轨迹、消费能力、价值取向等各种重要的用户画像信息。

  (4)物联网数据。各行各业都出现了物联网的需求和解决方案,每时每刻都在产生巨量的监测数据。

  那么如此之多的数据,包含着很多有价值的信息,这些信息并不是以直观的形式呈现出来的,需要有办法对这些数据进行处理,无论是计算、存储还是通信,都提出了很高的要求,云计算的相关技术就是对巨量数据的计算、存储和通信的解决方案。

  云计算是一种按使用量付费的IT服务模式,这种模式提供可用的、便捷的、按需的网络访问, 进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。

  那么云计算的定义中有一个最重要的关键词:按需。云计算提供商是根据用户需求,按需提供计算资源的,另外就是云计算架构具有很大的弹性,和扩展性,因为所有的实际物理资源都被虚拟化(抽象化),可配置和可管理。

  云计算技术包括分布式文件系统、分布式计算、分布式数据存储等。基于云计算架构,可以实现高并发处理系统来处理海量请求,也可以搭建存储海量数据的云存储系统,也可以搭建分布式计算系统来对数据进行挖掘。

  关于大数据和云计算的概念区别,我们总结一下:大数据说的是一种移动互联网和物联网背景下的应用场景,各种应用产生的巨量数据,需要处理和分析,挖掘有价值的信息;云计算说的是一种技术解决方案,就是利用这种技术可以解决计算、存储、数据库等一系列IT基础设施的按需构建的需求。两者并不是同一个层面的东西。

  那么上面说了大数据和云计算的区别,两者之间又有着非常紧密的联系。大数据是云计算非常重要的应用场景,而云计算则为大数据的处理和数据挖掘都提供了最佳的技术解决方案。

搜索