| 钱立强:
大家下午好,我们NCR
Teradata最大的特点我们做不了很多的事情,从沃尔玛等等全球最大的数据仓库都是我们建造的,我们最大的特点就是数据仓库的应用。
我们今天每个人都在谈论数据仓库的方向,我今天的讲座就是想,从这种方向来看,数据仓库实际上,现在面临的那种挑战和企业真正从数据仓库里面获得了什么样的竞争能力,他们是如何获得的。现在领导花了很多钱建造数据仓库,建造我们的BI,BI只是把一些报表和KPI指标反映出来,仅仅为少数的分析人员使用,世界和中国也好,都面临同样的一个问题,我花了那么多钱,我的结果仅仅是另外一种报表系统,过去几年中间,全球以及中国所有的用户他们都有一个新的转变,我们在规划我们的数据仓库的时候,我们设计我们数据仓库的时候,应当把数据仓库集成到整个流程里面去,应该和我们Call
center,和我们的客户经理,和我们Poss机,集成在一起,通过CRM的应用支持我的数据仓库的操作,数据仓库的价值更重要的是它能够在数据的价值可以有效的时候,我们的这种事件还能够挽回的时候,发挥更大的用处,这种需求的发展,对数据仓库技术本身也有一些新的要求,就是说原来我们讲数据仓库是一个后台的决策系统,现在我们要求他把它集成在一起提供24小时的服务,需要大数据量,需要数据质量等等等等,用这样一种趋势。
前面今天大家谈到很多关于数据仓库的发展过程,这是NCR认为,数据仓库发展的五个阶段,实际上我们以航空公司为例我们可以看到,在不同的阶段,它面临着不同的挑战,我们有报告,我们通过离港的数据可以看到我们航班延迟报告,可以看到我们财务报告,我们可以看到等等的报告,但是很大的一个问题,我的收入已经丧失了,我客户已经离开了,我能做什么,我通过动态查询,我可以看到他为什么离开,可能因为我们航班延迟和客户流失之间的关系我可以分析建模,但是所有这些事情,我们都没有提供一个亡羊补牢,或者我们是亡羊补牢了但是补的是下一个牢,这些羊已经走了。现在NCR
Teradata提供的数据仓库的概念以更快的数据进去,直接支持一线的这样的特点,另外一个最重要的特点就是说,原来我们讲数据仓库是一个后端的系统,只是一个下游的系统,所有前端的数据拿到这里分析以后,今天的数据仓库通过跨部门,跨系统的数据,可以迅速知道一些紧急的事件,从后端进入到前端。我们在全球的实践可以看到,与传统的数据仓库相比,有以下四个特点,我们现在可以认为这是一个动态的数据仓库,第一个特点就是说我们现在的数据在中国基本上能够做到每天来做加载,实际上这点是因为中国的客户他们起步了,起点比较高,但是在全世界很多的还是按月的,按周的在进。这个是你进去的更快,第二、我的使用,我的用户,原来我们所谓的决策者,管理者,操作层面,最重要的一个事情,数据仓库最重要的一个价值体现,一个名字就是你到底有多少用户使用你的数据仓库,在我们今天数据仓库直接支持你客户中心的人员,直接支持你社区经理,片区经理。第三、我们前面谈到的我们真正出来,一个客户,当他要流失的时候,或者银行的客户突然提了一大笔钱以后,这样一个重要的事件,通知相应的部门采取相应的行动,我在后面的幻灯里面会有详细的例子描述这一点,最后更普遍的一点,我们原来总是画一个蓝图,把数据仓库放到旁边,这是数据仓库,这是决策支持,今天数据仓库应该说是IT的蓝图的一部分,他是支持整个运营,支持整个在线的决策和离线决策很关键的一个部分。
基于这样的理念和实践,我们看怎么集成,怎么去做,这是Teradata的架构,我跟大家汇报一下,最重要的几个要点,第一个要点,在这个体系里面,数据仓库已经纳入到整个IT的蓝图里面,数据的组织方式和生产系统的组织方式是不一样的,这是很关键的一点,我们常常强调的模型,第二、传统的数据仓库,常常是所谓的下游系统,今天的数据仓库不仅仅是把数据加载到数据仓库里面,更重要的是他要把分析的结果反馈到生产系统里面,反馈到一线的支持系统里面,从而更快更及时的去支持一线的业务,整个都是现在所谓的SOA等等,我就不更多的讲了,第三个要点,就是我们前面谈到数据仓库能够主动的发起业务的流程。谈到实时企业的时候,关于这一点,有一个很大的误区,实时认为就是到秒级,实际上实时最重要的事情目标是消除你业务流程里面的延迟,可能我能够把我的数据五分钟就加进来,但是我根据数据做决策,我可能需要三个部门来审批,这个审批至少需要两天时间,我们认为你这样的流程里面,根本五分钟不是你这个流程里面最主要的延迟,你的延迟可能是你的管理,可能是你的企业内部的其他的流程,所以在这个时候,我们在规划数据仓库里面,数据刷新的时间的时候,我们更多的是要关注说,你的机构整个流程的反映有多快,现在数据仓库数据的及时性是不是你最关心的要点。第二、我可以做到5分钟,我打完电话以后我五分钟就可以查到我CDR,这样快的反应对企业能不能带来业务价值,就是说对于数据来讲,它的价值是这样子的,就是说我们为什么强调实时的,主动的数据仓库,就是我们希望传统的数据仓库主要是得到数据的长期的模型的价值,主动来实现数据,在他还有价值的时候,采取行动。
这是一个很真实的例子,是发生在美国的一个航空公司,有一个包括斯秘斯的白金客户,本来从夏威夷飞到纽约去,他是第四个航班开始从芝加哥飞到纽约,这个公司从洛杉矶飞芝加哥的航班已经取消掉了,他的下一个航班本来是从洛杉矶飞芝加哥的航班不再飞纽约了,这个时候由于他采用了实时的数据仓库,他数据半个小时传到数据仓库里面,告诉斯秘斯先生飞纽约的航班取消了,他马上通过CRM系统发了一个动作,给他的在芝加哥的客服中心,马上为这个先生安排另外一个航班,那个航班离的很近,让他半个小时连上从芝加哥到纽约的航班,通过Call
center他下一飞机以后就联系到,跟踪说这个人的反映,为下一次的诸如此类这样的行为做一些改进。就是说我们常常在讲数据仓库,数据仓库到底该谁用,我想这是一个很好的例子。
从整体来说,一个用户建数据仓库,选Teradata是专门建高端数据仓库的产品,用户为什么选Teradata,他选Teradata前后可以看到价值在哪儿,数据本身不是可用的,你构造自己业务流程的时候,必须围绕你哪些数据可用来建造。对电信异地网,这个人拿身份证来,然后就去入网,解决不了这个人在其他省入过网,这个人在其他地区是高欠费的客户,他解决不了,我做简单入网审核的流程,需要大量IT人员来参与,把整个客户信息进行整合,所以需要大量的IT的工作,第三、由于你的数据本身都还没有准备好,没有数据仓库来支撑,你所建的业务流程一定不是突破性的,没有带来直接的竞争力的流程,相反的是当你建完数据仓库以后,我们可以看到,他不再关心说我数据可不可用了,对于电信来讲,我的客户信息,以及他的这种消费的习惯,信用的习惯以及集成在一起了,当你异地入网的时候,他就可以调出信息来,这个用户在其他省实际上是一个高欠费的客户,我们给他的级别可能就有不一样的地方,第二、你IT不需要企业推一个新的流程,要推一个新的“抗盘”的时候,就不需要很多IT的付出,所以我们就是说,我们的那些用户,像美洲银行每周推300个市场的活动,不需要IT的参与。第三个部分,我们可以个讲到,你这样设计出来的流程,可能是你的竞争对手没办法做到的。
总结一下,数据仓库到底是怎么支持我们业务价值的,Teradata总结出来,可能有几点供在座各位老师参考,第一、数据要集中,我们要把跨部门多元的数据放在一起,刚刚前面讲到,我们放在一起的时候,应该是可以被所有的人在任何时候可以回答任何的问题,也就是说我们要注重这个模型。第三、我们常常会讲,可能最下面的生产人员需要细节数据,上面需要轻度汇总数据,更上面需要高度汇总数据,数据仓库最重要的事情把细节数据准备好,你并不知道客户的需求是什么,你没有办法保证今天的汇总保证明天的需求,第三、扩展能力,我们很多的平台,可能能够是一个TB,两个TB,但是当你的企业用户有一千两千用户在线的时候,这个平台是否能支撑,我们规划数据仓库的时候,是重点要考量的因素,最后一个就是说如何去直接支持这种业务流程,所有的真正体现价值的数据仓库,他都能够直接支持他的数据流程。
后面我就会用两个例子跟大家做一个汇报。沃尔玛大家知道,是一个很大的全球最大的一个零售商,每天最低号称有3900个超市在全球,最近我们去美国跟他们聊过一次,最近他做了已经过了啤酒尿布阶段了,他现在做到,当东海岸升起太阳的时候,东海岸商店开门了,他马上分析今天的货架摆放是否适合客户,太阳升起西海岸的时候,他已经按照每个人的购买模式把货架摆好了,这些故事讲起来很好听,我们分析出来,最重要的一个事情,另外一个理念,我们原来讲数据仓库是来做一个竞争的武器,今天BI的应用更多的是作为一个行业的门坎,沃尔玛所有的产品是由供应商你自己补货,数据仓库直接由供应商来存取和使用,供应商可以看到,我今天在北京的某个货架上的货马上两个小时就没了,供应商通过自己的物流系统补给沃尔玛,沃尔玛从来不给供应商先付钱的,现在这个模式在很多超市这种行业已经在普遍使用了,所有这种领先者,就是说先锋都是由沃尔玛来做到的。所以基于时间的关系,我就不很详细来谈沃尔玛如何利用数据仓库,一方面来提高竞争的门槛,另一方面扩大自己最大的利润。
这张图我们常常讲数据仓库的价值,这是沃尔玛的一个销售业绩的发展图,这条红线是80—90年,他的整个销售业绩的一个趋势,从90年他数据仓库投产这条绿线,他销售增长的趋势,蓝线是当他把这种篮子分析,我们买什么东西,组合分析放进数据仓库以后,是他这几年销售业绩的发展趋势,我们当然讲,一个企业的成功不仅仅靠一个数据仓库,但是从中我们可以看到,沃尔玛他通过数据仓库的价值,是可以实实在在看到的。
另外一个例子Harahs,他是拉斯维加斯娱乐业的一个公司,他建立BI系统获得全世界很多很多大奖,他有非常非常强的所谓用户忠诚计划,当一个人乘飞机到拉斯维加斯的时候,他已经知道你来了,你输多少钱以后,他提醒你应该离开了,这个故事是真的,后面我举了一个关于他在拉斯维加斯赌场,这是他各种老虎机,扑克,轮盘赌应用在数据分析之上。不同地板的颜色表示收入多少,这种桌子的颜色表示不同种类的这种娱乐的工具,他们当时要做这么一个分析,他们有一个色子机,他叫TPIR这么一个分析,他就发现,在这个色子机这里我们看到他的收入明显比他附近的要多得多,他再看一看,到底来玩这些色子机的都是一些什么样的人,通过数据仓库他可以看到,来玩这种色子机的人都是45—55岁的人,下一个问题他马上会问,这些人为什么没有去玩旁边更近的有些,他要玩哪项的游戏呢?后来他分析发现,这个图有点乱了,实际上当时这些人玩完这个老虎机以后,直接走到另外两个老虎机里面去了,玩了其他的游戏,接下来他就采取行动,第一、这些人的收入是不是已经到了我应该把这些赌场的布置应该把它放在一起,让他更容易的更方便的玩得更多,可以带来更多的收入,今天的话因为时间很短,我把这些故事讲给大家,对中国的企业来说,更重要的事情我们知道我们最终会走到这边,但是我们现在的问题可能我数据仓库还没有建设,谁能够和大家一起从现在走到这样一种数据仓库真正的提供很鲜明,很数字化的这种业绩,我想Teradata可以和大家一道来建设大家的数据仓库,谢谢大家。
|