木然云告诉你什么是“大数据”

-回复 -浏览
楼主 2018-12-13 01:12:38
举报 只看此人 收藏本贴 楼主

1、什么是大数据?

“大数据”是通过研究大量非结构化数据来理解和预测人类行为的新科学。 大数据也被称为“预测分析”。

分析Twitter的帖子,Facebook的饲料,eBay的搜索,GPS追踪器和ATM机是一些大数据的例子。学习安全视频,交通数据,天气模式,航班抵达,手机塔式日志和心率跟踪器是其他形式。大数据是一个每周都在变化的混乱的新科学,只有少数专家能够理解这一切。

2、常规生活中的大数据有哪些例子?

虽然大多数大数据项目都是非常模糊的,但有大数据影响个人,公司和政府的日常生活的成功案例:

预测病毒爆发:通过研究社会政治数据,天气和气候数据,以及医院/临床数据,这些科学家现在预告登革热爆发,提前4周通知。

凶杀观察: 这个大数据项目描述了华盛顿特区的谋杀案受害者,嫌犯和罪犯。作为尊重死者的一种方式,作为人们的意识资源,这个大数据项目是令人着迷的。

纽约市过境旅游规划: WNYC电台程序员史蒂夫·梅伦德斯(Steve Melendez)将在线地铁时间表与旅行行程软件结合在一起。他的创作让纽约人在地图上点击他们的位置,并预测火车和地铁的旅行时间。

施乐公司减少了劳动力的损失:呼叫中心的工作让情绪疲惫不堪。施乐公司已经在专业分析师的帮助下研究了大量的数据,现在他们可以预测哪些客服中心可能会留在公司最长的时间。

支持反恐: 执法部门通过研究社交媒体,财务记录,航班预订和安全数据,可以预测和定位恐怖嫌疑人,然后才能做出恶行。

基于社交媒体评论调整品牌营销:人们直言不讳地在酒吧,餐厅或健身俱乐部分享他们的在线想法。有可能研究这些数以百万计的社交媒体帖子,并向公司反馈人们对其服务的看法。

3、谁使用大数据?他们用它做什么?

许多整体企业使用大数据来调整产品和价格,以最大化客户满意度。

例如,梅西百货公司利用大数据来调整价格,为超过7000万种产品实时调整价格。他们甚至根据梅西认为自己感兴趣的东西,向客户发送定制的电子邮件。警方对波士顿马拉松爆炸事件的回应:利用大数据研究视频和监控图像,警方能够迅速缩小搜查嫌疑人的范围。莫顿的牛排餐厅使用推特来拉动营销特技,包括着名的新泽西机场提供的一家软式牛排和虾晚餐。Visa使用大数据来识别和抓住欺诈者。 这里和那里的单笔交易可以很容易地隐藏不诚实的信用卡用户,但通过仔细观察数百万笔交易,可以检测到欺诈的模式。Facebook使用大数据来定制广告。通过仔细研究你的FB喜欢和浏览习惯,这家社交媒体巨头对你的口味有着令人毛骨悚然的洞察力。您在Facebook上看到的侧边栏广告是通过非常有意思,复杂的算法来选择的,这些算法一直在关注您的Facebook习惯。

4、为什么大数据如此重大?

4件事情使大数据显着:

1.数据庞大。它不适合单个硬盘,更不用说USB盘。数据量远远超过了人类的头脑所能感知到的数量(想想十亿兆字节,然后再乘以十亿)。

数据很混乱,没有结构。 大数据工作的50%到80%正在转换和清理信息,以便搜索和排序。在我们这个星球上只有几千名专家完全知道如何做这个数据清理。这些专家还需要非常专业的工具,如 HPE和Hadoop来完成工作。也许10年后,大数据专家将会变成一打,但现在,他们是一个非常稀有的分析师,他们的工作仍然是非常模糊和乏味的。

数据已经成为一种可以出售和购买的商品。数据市场中存在公司和个人可以购买千兆字节的社交媒体和其他数据。大部分数据都是基于云的,因为它太大而无法放在任何一个硬盘上。购买数据通常涉及一个订阅费,插入云服务器场。

大数据的可能性是无止境的。 也许医生有一天会在事发之前几个星期预测心脏病发作和中风。通过对机械数据,交通和天气模式的预测分析,可能会降低飞机和汽车碰撞。在线约会可能会通过大数据预测器来改善谁是兼容性的人。音乐家可以深入了解什么是最适合目标观众口味变化的音乐作品。营养学家可能能够预测商店购买食物的哪种组合会加重或帮助一个人的医疗条件。 表面只被划伤,大数据的发现每周都在发生。

5、大数据是凌乱的

大数据是预测分析:将大量的非结构化数据转换为可搜索和可排序的数据。这是一个混乱和混乱的空间,需要一种特殊的知识和耐心。

以单片UPS交付服务为例。UPS的程序员研究驾驶者的GPS和智能手机的数据,分析最有效的方法来适应交通拥堵。这个GPS和智能手机的数据是庞大的,而不是自动准备分析。这些数据通过不同的智能手机硬件设备从各种GPS和地图数据库中输入。UPS分析师花了几个月的时间将所有数据转换成可以轻松搜索和排序的格式。虽然这个努力是值得的。今天,UPS开始使用这些大数据分析,已经节约了800多万加仑的燃料。

由于大数据是凌乱的,需要花费很多精力来清理和准备使用,所以数据科学家已经成为他们所做的所有繁琐工作的绰号“数据管理员”。

尽管如此,大数据和预测分析的科学每周都在改进。预计到2025年,所有人都可以轻易获得大数据。

6、大数据不是对隐私的侵入性威胁吗?

是的,如果我们的法律和个人隐私防护措施没有得到妥善管理,那么大数据就会侵犯个人隐私。就目前而言,Google和YouTube以及Facebook已经在跟踪您的每日在线习惯。您的智能手机和计算机生活每天都留下数字足迹,而复杂的公司正在研究这些足迹。

大数据法则正在演变。隐私是一种你现在必须承担个人责任的状态,因为你不能再期望它是一种默认的权利。

你可以做什么来保护你的隐私:

您可以采取的最大的一步是使用VPN网络连接掩盖您的日常习惯。VPN服务将扰乱您的信号,使您的身份和位置至少部分被跟踪器屏蔽。这不会让你100%匿名,但是一个VPN将会大大减少世界可以观察你的在线习惯。

7、我在哪里可以了解关于大数据的更多信息

大数据对于具有分析思维和对科技的热爱的人来说是一件有趣的事情。如果这是你,那么一定要访问这个有趣的大数据项目页面。关注木然云了解更多大数据相关信息

我要推荐
转发到