在信息技术快速发展的今天,大数据成为人们聚焦的热点词。有人说,大数据是智能时代重要的资源,相当于工业时代的石油。如果不理解大数据,就无法跟上这个时代的发展。
大数据基本要具备以下三点:
1、有海量的数据;
2、有对海量数据进行挖掘的需求;
3、有对海量数据进行挖掘的技术和工具(比如常见的有hadoop、spark等)。
大数据厉害的地方,首先在于客观。人的真实想法往往很难被人觉察。比如说,一个人可能情绪低落甚至抑郁,但是在人前的表现还是阳光外向。一个人可能有强烈的种族歧视心理,但是他不会告诉做测验的人。可是,搜索引擎提供了一个可以窥探人们真实心理的窗口。 当人们偷偷地搜索一些东西时,他的搜索关键词可能暴露了他的内心。所有这些搜索动作,包括关键词、时间、地点、乃至于是哪个人搜索的、前后有什么关联,搜索引擎全都记录在案,而且数据会被保留多年。当然,搜索引擎不会公布具体哪个人搜索了什么,但研究者不需要知道具体的个人,他只要知道有这么一些人在做这样的搜索,就足以对“人”多出很多了解。
大数据里面的数据,分三种类型:
(1)结构化的数据:即有固定格式和有限长度的数据。
(2)非结构化的数据:现在非结构化的数据越来越多,就是不定长、无固定格式的数据,例如网页、声音等。
(3)半结构化数据:是一些XML或者HTML的格式的数据。
获取大数据后,用这些数据做:数据采集、数据存储、数据清洗、数据分析、数据可视化
大数据的核心作用是数据价值化,简单的说就是大数据让数据产生各种“价值”,这个数据价值化的过程就是大数据要做的主要事情。
简单的说,大数据可以做的是:
记录一切
描述一切
预测一切
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
一个人哪怕再有经验,也是“小”数据。我们身边可供参考的样本本来就很少,而我们有时候还根本不采样分析 —— 我们会过高评价自己的个人感受,我们甚至可能只看到了自己。而大数据不仅让我们看别人,还告诉我们别人怎么看我们。这样新鲜的视角,难道不应该好好了解吗?
当然,大数据并不是全能的。对于金融市场这样的领域来说,数据量再大也无法预测股市的跌涨。而且,人们往往会过高评价可量化观测的东西。像微信运动上的步数记录,跟健康到底有多大关系呢?有人为了在社交网络上跟人比拼,想尽办法增加步数。这不是买椟还珠吗?本来我们应该更关心健康,现在成了关心步数——而这么做仅仅是因为健康不容易测量,步数很容易测量。
在大数据当道的时代,不可忽视的是,“人的因素”还是至关重要的。同样的数据,不同的人从不同的角度看,也许会发现不一样的点。数据毕竟只是一种强大的工具,运用的人,运用的方式,才是发挥其价值的关键。今后,我们不仅要学习大数据分析技术,还要拥有大数据的思维方式。在数字时代里,这将是认识世界、改造世界必不可少的素质。(相关推荐:女生选南京北大青鸟做UI设计达人)
还在担心大数据好就业吗?看了这么多大数据的作用,相信心里也有数了,所以别在犹豫了,你在犹豫的时候,别人已经迈进了学习脚步了,别总落后别人,赶快加紧脚步来北大青鸟学习大数据吧!好工作好就业等着你。