1#
人人都在说大数据,大数据到底是什么?大数据将如何改变和影响我们今天的生活?

你有没有假设过这样一种可能:如果你哪天需要把钱,转给你美国的朋友,但你只有支付宝,而他却只有一张Bank of America的银行卡,你们怎么支付?这时有三个选择:你去办一张Bank of America的银行卡;让你的朋友去申请一个支付宝;你把钱交给第三方,让第三方来进行汇总。
(--这就是互联网金融的机会)

如果你们经常这样汇来汇去,在互联网上开始累积交易记录,比如你喜欢在几点付款,你每次最高限额多少,你更喜欢用现金支付还是转账,你的朋友收到这笔钱,又一般用于什么消费了……这些消费能不能成为你和你朋友的信用,这些信用又怎样成为支撑你消费的决策,他们甚至能不能变现取代货币,让你随时随地…
(--这就是大数据的可能和能量)
                                                                                                  
大数据能干什么?大数据又意味着什么?
第一步:你的每一个行为都将成为你的数据
关于大数据,来自中美两国被提及最多的两个例子分别是——
中国版例子,来自十大元帅之一的林彪早年打仗时的习惯。据说,他每次打完仗,都要求部下准确地收集缴获的敌军器械情报:这不仅包括枪炮数量多少,还包括枪炮的口径大小,坦克的大小,弹药剩余多少等等……林彪将这些情报,随手记在自己的小本子上,作为他进行战斗部署的重要决策资料。有记录说,林彪多次依靠这样的数据分析,成功判断出敌军主力部队距离,最终成功获得战斗的胜利。

美国版的例子则是:美国一个山区的计算机搜索引擎关键词,在一段时间内,被发现有同样的异常行为:很多人都在同一段时期,不约而同地搜索某一种类似流感病情的发病症状。相关机构发现这个问题后,立即向当地政府报告了这件事。由于及时介入,一场可能爆发的流感被有效制止。

我对这个的理解是:大数据绝对不是高科技,自古就有。从人类最原始的以物易物,物品交换开始,其实大数据就已经存在。比如,一名用贝壳,向另一名拥有食物的人进行的交换,和他们交换的记录,这包括他们互相的评价,贝壳好不好,食物是否新鲜,这就是大数据。从这个角度上说,大数据是人类生活轨迹和生活行为客观存在的一种记录。

不过,因为互联网的崛起,打通了所有的信息阻碍,让信息交换不再成为一件难事。加上计算机本身对数据所拥有的超级处理能力,让人类对大数据捕捉、分析和挖掘都得到前所未有的质的提升。大数据从一个幕后默默无闻的“臭小子”,开始成为走近人们的“小精灵”,让我们开始发现它的“存在”——尽管它一直存在。

你的每一个行为,都会成为你的数据——请记住,是“你的”——你专属的,它只代表你。这些数据可以包括:你的出生年月日,你受教育的背景和程度,你开什么样的汽车,你每月月收入如何,甚至你还信用卡的方式是现金还是转账……

大数据掘金者们今天更主流的观点是:一切数据都是有价值的,没有什么数据是不重要的——甚至是一条写错了的信息,也是一条有价值的数据。一名来自google从事金融数据开发的工程师举了这样一个例子:他们通过一名消费者搬家的次数——即他/她对租房信息的搜索,可以准确地分析出这名消费者是否频繁迁移,而这又正好可能反映出这名消费者工作或生活正在或可能发生的变化和行为轨迹。

你的行为被转化为数据后,它所产生的价值,无论是对个人、社会还是商业,正在超过甚至突破你的想象力。来自美国房产信息网站Zillow的代表就直言不讳:“我们就是一个以数据为产品的公司”。在此之前,世界上很少有企业把“数据”作为自己的主营业务,最多是以数据为基础,为你提供决策分析。但今天,大家开始玩起了数据。Zillow硬是通过数据,把自己“玩”成了一个市值30亿美元的公司。他们的来源,就是无数美国人对房产信息的搜索。
这,就是你被记录的数据。


第二步:你的每一个数据都会被记录和分析
大数据到底怎么玩?目前大家比较广泛的认识,大概是这样:首先收集数据,比如你是否能建立一个满足你商业模式的完整的数据库。比如Zillow的代表说他们目前大概收集了1亿条美国房屋买卖的交易信息。

但这在中国并不容易。这个不容易的关键,来自国家体制和体系的不完善。在美国,信用体系是非常完善的,如果你没用及时处理你的帐单,那将非常被动。

第二步就是整理数据。你所收集的数据是否科学,是否有效,这并不是你把一堆数据收集起来就可以了,你还得去整理它。

说说我们车险无忧应用大数据的一个简单例子。比如我现在收集到的一个车主向我提交的汽车保险需求,我可以从四个指标来还原这名车主的“性格”:他的投保日期和他保险到期的日期,决定了他是否“有计划”;他对险种的选择,决定了他的生活轨迹和行为特点;他的理赔记录,决定了他作为个人对参与公共交通的态度;他对保险公司的选择,决定了他的消费导向和对服务的理解力。如果我都知道这是一个什么样的人,我就会更有针对性的帮他找到最适合他的汽车保险。

这就是你的每一个数据都会被记录,并被分析。我认为这正是大数据给我们每一个人带来的普惠价值和机会所在。互联网和移动互联网,让地球越来越小,让我们的生活越来越便捷,这我认为应该是第一个机遇;那它带来的第二个机遇是什么,我认为应该是基于每一个个体的人性化,大数据为这样的人性化实现,提供了最大程度的可能。

其实数据带来的个性化广泛存在。比如,我是星巴克星享俱乐部的会员,通过会员这个体系本身,星巴克自身早已对我对咖啡的口味、大杯还是超大杯、是否加奶油、我一般什么时候去……有了准确的数据和分析。这个数据和分析本身,不仅可以为星巴克提供更多的决策支持,更能为我带来更好的服务和体验。比如,我去刷一下卡,就不用再问我喝什么了吧。

这样的大数据记录和分析,今天,正在因为互联网和移动互联网,变得越来越触手可及。来自PayPai的陆杰讯,向我们分享了他们公司怎么用大数据的记录和分析判断,提前发现并预知了金融危机的到来。

2005年之前——即金融危机来临前,他们对用户服务器访问银行网站IP地址分析发现,绝大多数用户都是来自于办公室,但是,从2005年开始,他们发现访问银行IP地址的来源,已经从办公室转移到了一些公共图书馆、甚至是星巴克免费的wifi。PayPai的管理层很快感知到了这个不寻常的变化,并进行了深度的分析,事实很快得到验证:很多人当时其实已经处于全失业,或半失业状态。
很快,金融危机爆发了。

第三步:你的数据将转化为你的信用,并成为必须履行的责任约束
你的数据被记录,被分析后,用来干什么?这只有一条路,成为你的信用。无论是在美国,还是在今天的中国,无论是google对金融的思考,还是阿里信用体系建设,尽管打造和实现这个信用体系的路径不同,但是他们殊途同归:都是为了对你的信用进行分析和风险控制,用你的数据,最后还原你。

在这方面,我们车险无忧一名联合创始人兼副总裁,就有非常深刻的体会。他早年在美国的一家汽车保险公司工作时,就曾开发过一个名为good student的汽车保险:一些刚入学的大学生,由于没有稳定的收入,他们就按照这些大学生的成绩单,作为数据和参考,并就此建立起一套评估这名学生可能存在的风险的模型,随之根据模型的风险控制能力,开发出不同汽车保险费用等级的汽车保险。最后他告诉我,这样做非常棒,不但有效地控制了风险,后来这批学生大学毕业后,对这家汽车保险公司的感觉非常好,持续性和黏性都超出他们的预期。这就是典型的把数据转化成信用,再把信用转化成产品的例子。

我认为这样的、未来每个人的数据,将因此变得非常有趣。比如,你的微博,有多少人关注、这些关注的人当中,有多少人是认证的,认证的人中他们又在从事什么样的职业,你发了微博,有多少阅读量,多少转发量,你的粉丝构成是什么……如果通过大数据来分析这些一个个真实的个人与社会、个人与群体的点滴,它将在最大程度上,还原你一个最完整的社交圈子和关系图谱——你关注什么样的人,这些人又是什么样的标签,这决定了你的圈子和格局,这其实也就是你和你所处的世界的联系。

这个有什么用?非常有用。与传统行业消费前置型——即你买个电视机,先付钱,再把电视机拿走不同的是,尤其在互联网金融业(特别是银行和保险),大多属于风险前置型——即银行要放贷给你,必须要对你的工作、房产等等信用体系做一个风险防范的评估,这样他们才能决定是否放贷给你,贷多少;保险公司一样,你买了保险,如果索赔率很高,那保险公司是肯定要赔钱的。如何在前端更好的防范风险,让风险变得可控?唯一的出路,就是对可能存在的风险就行分析,将他数据化还原,从过去的规律中找出风险发生的可能性,判断接受这个风险的风险。

无论是银行,还是保险,还是证券,要想实现对一个人,即一个个体的风险防范,仅仅依靠“已知”的判断,这是远远是不够的。比如,这个人有房产是事实,但他是否按时足额还贷款,这时就显得更为重要。互联网金融业要实现更好的风险防范,唯一的路径只能依靠大数据的分析和挖掘,从数据本身还原一个人或一个企业的真实,这才是最可靠的。因为一个人不大可能为了申请某个折扣,去连续打几场高尔夫,连续一个月每天买书。

这意味着什么?意味着你被记录的数据,会成为你的个体标签和行为分析,这些标签和行为分析,又会成为你的信用。这个信用,已经或正在实现与你生活价值的关联,最终成为你必须履行的责任约束。

第四步:大数据将帮你把信用转化为有价值的无形资产
大数据未来将从哪里来?

我个人认为会来自三个方面:一是你自身的收集,比如像携程网在向你提供机票酒店预订的时候,实际上已经收集了你对这个服务需求的数据,不过你首先需要向你预备收集数据的对象,提供有价值的服务,不然你收集不到;

二是来自于你合作伙伴的共享,这很容易理解,比如一个做二手车的企业,就可以和我们车险无忧合作,我可以向他们分享这台二手车的理赔记录,帮助他们更好地识别这台二手车是否有问题,降低他们收购或购买的风险;

最后则来自于通过技术手段,对用户包括社交工具留下的碎片化抓取和分析,未来甚至很有可能通过你所发的微博,被人点了多少个赞,这也会成为一个数据分析的指标。因为这是真实的,你的朋友点的,你的朋友也可以被找到。

关于如何收集大数据,国内外的科技创新型企业其实也正在绞尽脑汁。现在的事实证明:最土逼的,可能是最好的——还是因为真实。美国一家公司是这样获取大数据的:他们买了几台车,在车上装了一个摄像头,分线路每天在全城跑来跑去,把大街上停在路旁的车全部收进镜头,然后再回去导入模型,开始做数据分析:这条街什么价位的车比较多,同一车在不同街区出现的频率多大……我个人认为这非常有价值。比如,有了这些数据,这就可以为广告主实现更加精准和现实的营销解决方案。这也就是为什么大数据很热,大家纷纷把大数据认为是“新时代的石油”的原因所在吧。

——可能你已经意识到了,很显然,大数据可能或正在侵犯我们的隐私。事实上这样的事情已经发生,美国有一家很有创意的公司,就找黑帮合作,从他们手中买到一些“特殊客户”的名单,向他们提供金融贷款服务,这些特殊客户,如果走正常途径,是不大容易好贷款的。不过我认为,无论是中国还是美国,大数据更多的还是在一个公共的、开放的平台上获取你的信息,比如你搜索某一件商品,你把车停在路边,这本身并没有涉及到你的隐私——从法律的观点看,你基于这件事的前提是,你已经允许把自己的行为放在一个公共环境之下。当然,大数据肯定还有其他问题,但我认为,与其把它视作洪水猛兽,不如把它看作大数据本身对人类的挑战,我们应该思考如何去开发和利用它,并让它为我们的生活服务,这才更加有意义。这个道理,就像人类对电的改造和利用一样。

大数据不仅帮你建立信用,还会让你把信用转化为无形的资产,让你受益。淘宝不就已经可以实现用信用来贷款了么,这也正在成为国内以P2P模式为主的互联网创业项目的努力所在。大数据所为你积累的每一个信息,在未来不光将为你实现消费能力提供支撑,更帮你实现了你的消费意愿。前面说到的美国房产信息网站Zillow,他们真正崛起的核心,就是通过大数据的分析挖掘,智能演算,最终开发出一个很有意思的产品和体验:你可以通过Zillow,分析你的房产价值曲线,你的房产每一天值多少钱,你都能查出来。在应用大数据之前,这在美国从未有过。

更多的大数据积累,还来自于从整合中发现的新机会。另一位美国的创业者,开发出一个类似股市交易所“黑盒子”的产品,这个产品基于对股市历史数据的分析和抓取,解决了交易所信息发布几分钟的时间差,可以让你提前几分钟知道相关信息,这是一件多么有趣和有价值的事情啊!

我认为,以数据和数据中产生的价值为核心驱动的公司,在未来的竞争中最终必将胜出。一名叫潘巍的创业者,正在美国读博士后,还有几个月就要毕业了。但当他深入了解大数据后,毅然决定暂停学业,出来创业,做了一个基于大数据对对冲基金分析和预测的产品公司,非常有前景。他是这样描述自己当时的兴奋的:“我的老师说,你不能等一下毕业了再去么?他说:我现在一天都不能耽搁。”这样的故事,今天正在世界各地,正在太阳升起的每一个城市,正在无数热爱大数据的创业者中悄悄发生,这激动人心,充满力量。每一个对大数据着迷的人,眼睛都闪烁着智慧的光芒。

或许,人类自身对大数据的探索,本身就是一个充满惊喜和挑战的过程。大数据就是一切:从你早上起床开始,从你触摸每一个带电的电器开始,从你发布每一天微博微信开始……这些数据和分析,构成了你的人生生活轨迹,对这个轨迹捕捉本身,是为了让我们的生活更美好!
拥抱大数据,你已经知道未来。

来源:互联网
PS:网舟科技([url]www.eship.com.cn[/url])长期专注于金融保险、通信、互联网、旅游酒店等行业的电子渠道大数据运营,为客户提供全球领先的电子渠道转型咨询、大数据挖掘和应用定制服务,助力客户互联网转型,提升数字化运营和数据营销能力。