首页 移动互联_抓取资讯

大数据揭幕战 看百度、微软、谷歌一较高下

今年的世界杯热度异常,让真球迷和伪球迷都为之狂热,是足球本身的魅力吗?其实应该是足彩的魅力还要更大一些吧。从微博、朋友圈每天刷屏的消息,除了那么一两个人在评论昨夜谁踢的好,谁调兵遣将到位之外,其他人都在说,昨晚赢了多少,昨晚的世界杯预测哪家坑爹,哪家准;不得不说,移动互联网的到来,让世界杯变得更热闹了。而大数据对世界杯赛果的预测,则扮演了推波助澜的效果,世界杯预测把多少人从天台边缘拉回来,多少人又靠它发家致富。

世界杯开启大数据揭幕战

本届世界杯开始后,手机上各种APP推出买足彩的功能,让小白用户都能凑一把热闹。但是本次世界杯着实让球迷感受了一把惊喜不断,让彩迷感受了一把“惊吓”不断。许多球队势均力敌,让彩迷们对赛果捉摸不透;当然许多本应该焦灼的比赛,却成了一边倒的虐战,比如德国7-1挑落巴西,让多少巴西球迷哭晕在酒吧……广大彩迷一个月来,思考最多的莫过于如何避免买彩毁一生的境遇呢?靠骆驼、贝利或者大数据预测?从现在的情况来看,贝利是早就废了,大数据预测可能是最准的。事实上,百度和微软从1/8决赛、1/4决赛、半决赛到最后的德阿巅峰之战,都保持了预测正确的记录。当然,别看两家成绩斐然,能猜中胜负结果其实并不是板上钉钉那么简单,谷歌和高盛就预测错了巴西与德国的王者之战。网传有个85后东北女球迷,照着百度推出的世界杯预测结果,在世界杯期间狂赚330万。笔者生来不好赌,要是有这个勇气照这样买下来,现在已经在去塞班岛度假的路上了。

虽然本届世界杯冷门不断,但也让我们意识到,那些可能原本没有规律的事情,已经在渐渐地通过数据的处理之后呈现出来了它潜在的规律。你可知道预测世界杯的球队胜负走向要处理多少数据?根据预测成绩领先的微软和百度透露的预测模型来看,双方不仅依据了球队、球员过去的比赛情况,更重要的是,双方都依据了必发指数这一欧洲市场最具权威性的赔率指数,而百度则在此基础上,综合了欧赔469家公司的赔率数据。之所以称之为大数据分析,是因为它背后涵盖了太多的广泛的信息数据。

当下是大数据狂热的爆发季,之所这这么说,是因为它的舞台还远不止在世界杯。在微博上持续火热的小冰,就引起了很多网民对这个“新朋友”的兴趣,这是一类典型的基于大数据的交互聊天机器人。小冰的大数据体现在它集合了中国近7亿网民多年来积累的、全部公开的文献记录,凭借大数据、自然语义分析、机器学习和深度神经网络方面的技术,通过理解对话的语境与语义,实现了人机问答的自然交互。另一类聊天机器人,不仅能满足聊天需求,还能解燃眉之急。高考期间,百度推出一款百度考霸,考生填报志愿时,对于希望得知的信息,只要以对话方式提问,如“去年清华在东北的分数线”,百度考霸就能给出清华大学2013年在黑龙江、辽宁、吉林三省的分数线;而且这款产品还能通过交互,加强服务的精准度,如果考生希望知道“600分可以上哪些学校”时,百度考霸会向用户提问,通过这些问题智能分析考生高考地的录取分数线及各高校在该地区的招考情况,给出考生一份“智能”的高校推荐表。

除了以上这些例子之外,大数据的应用还包括景点假期拥挤程度预测,道路交通预测,疾病预测等等,我们发现已经有越来越多的大数据预测产品在进一步接近我们的生活。但是大数据之所以还不能成为全能战士,在我们生活的每个角落展示威力,是因为它还不够智能,只能对数字和数字化的元素进行分析,如何让它未来成为全能战士让我们的生活更美好呢?

大数据要成全能战士?还得倚仗人工智能

首先我们要了解大数据的预测公式,实际上这就是一个无线接近“1”的公式,只能做的无限接近,因为这个“1”毕竟还没有发生。那在不同领域的预测中,预测结果是否值得依赖,我们可以看三点:1.基础分析数据是否足够大;2.数据参数是否广泛;3.关键参数是否标准化。这就好比一个分数,分母是未来将要发生的结果,分子是证明可能发生这种结果的前兆,通过积累和抓取到越来越多的分子,当分数数值愈加接近“1”,现在的预测力度就愈加接近可能。

要让大数据更加智能,把尽可能多的参数进行分析,其中“标准化”这一块至关重要的。“标准化”如今是大数据产品重要的门槛之一,也便是“人工智能”要跟大数据发生化学反应的主要原因,因为不是所有的数据都是数字化的,所以就需要人工智能来进行转化成标准的可分析数据。例如你要分析股市发展情况,就网络舆情来说,第一个动作就是要对舆情的正负以及影响力进行评估,这就涉及了人工智能对语义语境的理解分析和结果反馈,以前的计算是判断0or1,然后进行反馈,明显在人工智能的大数据时代,计算机需要面对的不再是简单的数字,而是真正来自于用户的交流指令。

大数据本身及其用途已经毋庸质疑,生物、医学、天文、环境、物理、工程、经济、互联网等诸多领域都开始出现基于数据的利用研究,尤其在交通管理、城市布局、市政设施等政府社会管理多个方面用途很大,数据思维也越来越被重视,但没有人工智能对于非数字条件的转化,数据分析就不可能成为万能战士。

互联网巨头排兵布阵争夺大数据未来

从这次世界杯来看,在当下玩大数据的公司,主要包括互联网公司微软、谷歌、百度,还有华尔街巨头高盛、德意志银行,甚至还有彭博社。虽然几大公司看起来风马牛不相及,但他们拥有共同特点是自身积累的大数据基础。但是从最新的预测数据来看,华尔街巨头和新闻社这类的企业,可能在预测上也要成为被互联网公司颠覆的“传统行业者”。

首先互联网巨头在大数据的积累和技术上,有更突出的优势。在国外,微软在今年确定“移动为先、以云为先”的战略,这两大转型重点的桥梁便是数据驱动力,其大数据解决方案核心产品之一的SQLServer2014,可与WindowsAzure相结合;谷歌就更不用说了,核心的搜索业务是其搜罗大数据的巨量入口,在处理大数据上也有深度学习的技术探索;连Amazon都是一家不折不扣的大数据公司,虽然人们印象中,它是一个纯电商,但Amazon本质上是一家通过云基础构架服务赚钱。在国内,对于大数据的积累和处理最为激进的要属百度,它与谷歌的发展路径是类似的,不久前引入谷歌大脑吴恩达,也可以看到起在人工智能上布局的意图更清晰。从最近百度在大数据上开发的产品,可以看出它再全球大数据领域占领了一席之地。

此外,颠覆者和被颠覆者的区别在于,前者总是热衷技术探索,布局未来。在移动互联网时代,大数据产品的处理结果,匹配人工智能和智能硬件再适合不过,这也是譬如苹果、谷歌、百度和三星这样的企业都着力布局智能硬件的原因之一。试想如果谷歌、苹果、百度分别将某fit、某kit和百度inside与运动员的身体状况、士气状态、天气等结合起来,收集更多元化的数据,并利用人工智能将其处理成有助于预测的数据资料,那么这些数据将成为无限大的分子,让预测的分数愈发接近“1”。到时候借助这样的预测结果,全民成土豪可能就不是梦了?!(不过到时候还能不能有足彩,笔者不敢说……)

大数据本身及其用途已经毋庸质疑,日后也一定会在更多的领域渗透和开展起来,并且会越来越接近人们的日常生活之中,曾经有人说互联网改变了人们的生活方式,那么现在看来,在未来改变人们生活的,可能更多是基于移动互联网和大数据的人工智能产品,它可能无处不在地使人们的生活趋于更优。

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多