
台湾辅仁大学统计系谢邦昌
点击此处查看全部新闻图片
2007年10月16日,第五届中国市场研究双年会已经进入第二阶段,会议继续紧张有序地进行。上图为台湾辅仁大学统计系谢邦昌教授正在做演讲,主题是“商务智能与数据挖掘在市场调查之应用及其未来发展”,具体内容如下:
各位嘉宾好!很高兴来到这里。我演讲的题目是商务智能与数据挖掘在市场调查之应用及其未来的发展。我想应该是1998年柯老师到台湾,看到了很多台湾的市场调研公司,觉得中国大陆不久应该向台湾那样的蓬勃发展。除了这个之外也为中国市场调研方面奠定了深厚的基础,应该向柯老师表示敬意。
今天跟大家谈这个题目,其实昨天听了一个统计数字,就是说今年2007年全年的调查是243亿美金BI(音)的市场是2400亿美金,也就是说我希望讲完这个题目之后,希望带给大家另外一个蓝海。
实际上(英语)是什么?就是各位我们做市场调研,建立了很多数据库,我们最重要希望得到(英语),这些东西基本上叫做BI。实际上我们都在做BI,我们把BI的城市拉高,这是一个很重要的原因。
CRM是最典型的,我们的市场调研中扮演着很重要的角色,我们只是在(英语)过程中,我们没有得到我们的价值。在这个过程中,IT似乎扮演着很重要的角色,但是不要忘记(英语)才是主角。
所以后面这一块,我们无论前面的网络银行、或者各种业务,我们跟客户接触所作出决策是经过(英语),或者(英语)所得到的(英语),然后才能产生营销、才能产生销售、才能产生服务自动化。所以这方面(英语)的产生才是核心中的核心。
所以管理过程中,以这个过程来讲,我们经常做(英语)这方面的产品定位,我们好像每天都在做这些东西。但是这些东西提供营销、发展、产生一些价值性质后,我们的价值在哪里?我们产生了很多的(英语),好像(英语)产生没有用,不要忘记(英语)的产生就代表着你财富的累计,这是我要讲的。
在这个过程当中隐含着太多的(英语)等等,这些都是(英语)的技巧。但是不可能只做一次,你可能做所谓的时间点,甚至不同数据库的整合这方面的(英语)。怎么做?其实变得越来越重要。
我简单举一个例子,你中间有人口普查相关的资料,你再有客户的(英语),你怎么把这两个数据结合在一起,产生更丰富的信息?这个变得越来越重要,这是一个简单的观念。
那产品的定位也是一样的,太多的产品你没有接触到,你怎么从现在的数据库中间去找出那个客户?肯定要做产品的定位。那么这方面的(英语)就可以帮助你去做这些事情。所以(英语)这方面,结合(英语)价值性就更高。那么传统上面你找目标客户跟目标产品做(英语),但是不要忘记假设在这个过程中加入(英语),你的目标客户跟目标产品就会有相辅相成的效果。
最后经营绩效的分析。就是说其实大家(英语)呈现这种(英语),现在的TBI,现在所谓的平衡记分卡,(英语)跟TBI做绩效方面的整合分析。所以这样来讲,这方面的分析变得越来越重要,其实工具越来越简单、越来越方便。所以刚刚整合的过程,我们从客户面到产品面到整个市场面,我们现在来讲,我们假设加入了BI跟(英语),甚至我们后面讲的(英语)价值性,那我们的(英语)就能从243亿美元到2400亿美金,这绝对是可能的。你经常做很多的调查,你做的事情是(英语),你做资料数据的收集以后,你用不同的方法去做,但是不要忘记数据的收集不是一次性的,还是累计性的。资料量越来越大,代表他的价值越来越高,所以我们要建立(英语),产生以后这些东西你再从(英语)、(英语)中间产生(英语),那么你要做(英语)。其实就是(英语)。
你在海量的数据中间怎么找到数据的价值性?怎么找到数据的关联性?怎么找到数据的驱动性这是很重要的。后面你可以做不同的决策,所以(英语)是(英语)。基本上是(英语)。但是现在不同的(英语)方法都进来了,不止统计、IT的分析方法进来了,越来越多的分析方法进来了,所以它是一个看起来像瞎子摸象,但是在大量中找(英语),这个是很简单的观念。所以这是一个(英语),这个很好玩。
96年接近40、50,从96年拿到CAI技术第一,实际上就是做BII(音),待会儿介绍(英语)就知道(英语)跟(英语)的重要性。为什么做数据挖掘?我们现在的数据量太大了,越来越大的。每天接触不同的数据量,这么多的数据量怎么做解决?每年数以千万计的资料要进来怎么做?这是一个(英语),我经常举的例子。
2002年说未来十大创新就是(英语)、数字挖掘、数字管理、所谓的(英语)方面,是未来十大创新技术,大家不得不重视的技术。所以(英语)跟商业智能一定要知道的。
回顾从DOS系统到现在的Vista,你剩下什么?这20年留下(英语),你要做什么?你要知道这个趋势就可以知道,未来不是软件、硬件的问题,而是(英语),谁是(英语)谁就是赢家。做预测、做关联性分析、序列、大概占到80%到90%。以往来讲大家觉得(英语)是好贵好贵,现在玩(英语)好简单也不贵了。5年前、10年前要玩(英语),你至少要上百万、甚至上千万。那现在几万块钱就可以了。为什么呢?因为(英语)进来了,(英语)进来了,不是你不喜欢(英语),但是(英语)进来这个领域,代表这个领域普及化了。所以2007年就有这些所有的分析方法了。经常什么时候每天遇到那么多,很少,所以这些最简单的(英语)有的一些(英语)。
我们这里不细分了,最重要另外一个叫做(英语),也就是说我们现在处理数据已经不只是数字,而是文字、语音。(英语)现在已经不只是数字上面的满不满意?而是处理(英语)开放式问卷得可以要(英语)来做处理。所以现在处理资料量、信息量越来越大了。这是一个。
所以(英语)的起因就是(英语)的配合,现在正是适合。结合不同领域进来了,所以变成各个领域都在这里面。所以它是一个过程,收集资料、整理资料、分析资料、萃取数据的过程。所以有一个过程叫做(英语),一个跨行业、跨领域的一个标准程序就是我刚才讲的收集树立、整理数据、做出分析模型、然后产生一个结构的过程,这是一个标准的过程。假设是你的客户、不是你的客户、是你的忠诚客户,你怎么样对他(英语)是很简单的。是你的客户要把他变成你的忠诚客户,你的忠诚客户变成不能流失的客户。在这个过程当中,你怎么用(英语)找到你的客户、留住你的客户就随时在(英语),就是所谓的(英语)。
所以都在做,在台湾我们经常讲(英语)指每天都在产生智慧,人工智慧的成长迅速,所以这是我刚才讲的整个过程。
所以很多问题不要忘记,我们以前是客户委托某项事情才去收集数据,现在很多数据库就在这里,你很多时候可以帮客户,找住客户的问题,随时去找,那么价值性就出来了,所以2410的观念就出来了。所以数据的来源要建立(英语),从不同层面建立(英语),从模型端、客户端去建立(英语),然后去找出适合的模型。
但是这个又跟统计不太一样,统计有假设假定,这里没有假设假定。我这里解释叫(英语),相同(英语)不同的时间点、区域、类别你用相同的模型都不一样,所以你要做不同的CRISP。
不需要高深的统计知识就需要知道这个模型好,那个模型不好。所以接下来都做得差不多以后,就像(英语)这方式去呈现给决策者、消费者。整个过程大家可以知道,DataMining动态的商业价值提升了。现有客户手上的东西我帮他去做分析,金融保险零售都在做。所以这个领域当中都是包罗万象的,不同的分析方法用在不同的问题方面,都是很好的。不同类型的(英语)很可能模型不一样,所以要不断的(英语)。
最后告诉大家现在正火红的叫做(英语),讲文件类型,我们经常做到所谓的开放式问卷,很多篇文章怎么用电脑来读文章?将电脑经济统计、经过专家判断以后,加以量化,量化完以后一样做(英语)。做完(英语)之后找出它之间的关联性,找出议题之间的关联性。这些文章深入的探讨,这些文章结构之间的关系,甚至它的强度跟趋势。我收集了上千篇、上百篇文章,然后我来做(英语),这是现在很流行的一个技巧。
接下来就是知识呈现,知识呈现是多样性的,所以就变成不但是数字化的呈现,而且是文字化的呈现,都可以做很丰盛的呈现。所以这两天来从(英语)、(英语)然后到访问端到网络调查,到后面做客户形象的满意。我们原有的(英语)结合(英语)以后,就可以BI。现在已经在(英语)的平台上结合Office,然后把BI平台构建起来。所以大家可以看到,透过这些种种、Office的平台建立(英语),包括平衡记分卡都在里面。
好不好,不见得好,但是(英语)一进来,就代表软件不是很贵的。所以我们以后的(英语)这些,一定要站在BI的平台上现在卖10万块,以后才可以卖的100万。所以大家可以看到整个BI平台,就是在(英语),有(英语)、(英语),所以这一套叫做(英语)。Monitor这方面的平台就是这样的。
但是在这个平台上面代表说接触了BI平台的贫民化,我们今天很重要一点是(英语),我听了两天的演讲就知道是相当厉害的,如果在这个专业中间再深入?再结合BI,让你的设备做得更好,让帮手做得更好,应该靠大家一起来努力,我的演讲到这里,谢谢大家!
主持人:我想我们在茶歇的时候可以跟谢老师讨论,在这次上年会有一个非常大的收获,我们这个行业有10倍的增速。因为最新的行业调查显示,行业整个的增速现在开始放缓,以前几年都是20%的速度,从今年开始就是已经降到了15%,谢老师给我们出了一个招,还可以有1000%的收入,那就是今天你卖了吗?