关于(只要会用鼠标)都成为数据挖掘高手’的质疑

本人认为能够对数据进行预测和挖掘必须拥有两个最起码的必要条件:
1:对影响客户实际业务运行的各项‘因子’经过客观的实际调研后的深刻理解。
2:专业的数据挖掘算法的实现能力(很多情况下,用户数据的内在规律及联系不是一两条简单的数学算法就能够体现出来的!而且1,2,3,4,5,6。。。及1+1=2这样的业务事实也是没有必要用计算机来预测和挖掘的,甚至某些情况下强行对简单明了的业务事实的预测和挖掘很可能会误导用户及浪费用户宝贵的上机时间)

目前国内数据挖掘技术并不成熟(甚至是直接面向应用的手工定制),真正实现的比较理想的数据预测及数据挖掘项目也并不是很多。更请不要大谈‘用鼠标实现的数据挖掘’了。而实际操作过‘用鼠标实现的数据挖掘’的用户相信也只会
发出这样的感慨‘用过这个神奇的东东后,基本上我再也看不懂我的业务了!!!’

以上是本人的一些看法,希望大家多多交流。

作者: glad   发布时间: 2002-06-13

同意。

作者: tiantianoracle   发布时间: 2002-06-13

如果我是井底的青蛙,我也会说:天,不就是井口那么大吗

作者: roamer   发布时间: 2002-06-13

要搞挖掘懂的东西真的太多了
我不知道这样认为对不对
挖掘是对黑箱操作,得到数据关联的模式,而这种模式又可由管理人员对此进行解释
但有时常把统计跟挖掘混在一起

作者: justforit   发布时间: 2002-06-14

需要一些统计学的知识, 还好当时学的数理统计没全忘光.

作者: roamer   发布时间: 2002-06-14

我想实际上确实也是这样。数据挖掘过程其中涉及到的内容不可能用一两个数学公式或简单的工具点击几下鼠标来实现。而且相对简单的业务事实也是没必要用数据挖掘的了。

作者: discover   发布时间: 2002-06-24

现在算法到是有一大堆,问题是模型的建立,不是很好办
而且,可能针对某一些应用,可以实现如QDKX兄所说的,
但是,有一些可能是无法实现的,必须针对某一个应用建特别的模型

作者: qdkx   发布时间: 2002-06-25

如今做产品要比做项目实惠的多
关键是要有眼光.

作者: justforit   发布时间: 2002-06-25

产品做到一定程度还要有途径去推才行

作者: roamer   发布时间: 2002-06-25

以下是我发表的原文及其详细注解:

本人认为能够对数据进行预测和挖掘必须拥有两个最起码的必要条件:
我的原文中1:对影响客户实际业务运行的各项‘因子’经过客观的实际调研后的深刻理解。

注解:请注意这第一个条件是专业人员在实施数据挖掘项目时本着对用户负责的态度必须进行的重要一步。
不经过这一步请不要妄谈‘为用户预测和挖掘数据’。更不要妄谈‘用鼠标实现的数据挖掘’!

我的原文中2:专业的数据挖掘算法的实现能力(很多情况下,用户数据的内在规律及联系不是一两条简单的数学算法就能够体现出来的!而且象1,2,3,4,5,6。。。及1+1=2这样的业务事实也是没有必要用计算机来预测和挖掘的,甚至某些情况下强行对简单明了的业务事实的预测和挖掘很可能会误导用户及浪费用户宝贵的上机时间)

注解:在此首先借用一下‘qdkx’发表文章中的原文:“大部分人认为计算机是专业人事研究的,因该通过实际的需求定制(单版机)。但开发通用计算机的人们则大胆的将大部分不通用的功能全部删除,才有了今天的人人都会操作的计算机。 ”
我在此深表对‘qdkx’大胆的引用类比的惊讶!首先:计算机的设计过程的确是可以通过简化某些步骤来实现的,但即便是在计算机的设计过程中出现的最大胆的设想也是必须以‘真正能够对人们有用’为目的出发的!!!而决不是依靠‘一相情愿的大胆的随便删除什么东西’来创作出一个计算机来,否则真不知道今天大家还能不能买到一台计算机来进行‘网上论坛了’!!!至于qdkx原文中“关系型数据库(二维表格)将大量的不能用二维表格表现的信息全部弃之不管,才有了今天关系型数据库在计算机信息管理中的绝对统治地位。 ”更是类比的不可理喻!!!

其次:数据挖掘是直接面向最终用户所提出的最实际的业务数据分析需求的项目实施过程。而用户的需求通常绝不会是“1+1的哥德巴赫猜想证明”或“否定牛顿三大定律挖掘出爱因斯坦的相对论”(我还是觉得通常情况下我们是不可以随便的对用户所提出的实际需求采取放心的“弃之不管”的做法!)。在此还请qdkx不要过分担心,本人并没有向您提出“连全世界的教授博士都难以实现的数据挖掘”的要求。
我只想请qdkx重新看一下我的中文原文:“象1,2,3,4,5,6。。。及1+1=2这样的业务事实也是没有必要用计算机来预测和挖掘的,甚至某些情况下强行对简单明了的业务事实的预测和挖掘很可能会误导用户及浪费用户宝贵的上机时间)”我想我举例的是连小学生都可以回答的问题!(想必也不必惊动全世界的教授博士吧???)

我想重申一遍:在实际操作中哪怕是用户提出的最平常的数据挖掘要求,也通常不是一两条简单的数学算法就能够解决了事的。因此在下实在是不能相信什么‘用鼠标实现的数据挖掘’了。

作者: cxgtommy   发布时间: 2002-06-26

收藏!

作者: qdkx   发布时间: 2002-06-26

数据挖掘的专业性很强,如果只是用鼠标完成,需要事先做好大量的工作。可能未来会有,但现在这个环境不具备,如果去尝试,也是失败的

作者: glad   发布时间: 2002-06-26

这是一个尚未充分发展的学科。

作者: lutian   发布时间: 2004-09-28

这个问题将会一直讨论到只要会用鼠标就都成为数据挖掘高手的时代的到来。

作者: xingyucwz   发布时间: 2004-09-29

不是每一个业务问题都采数据挖掘,在某些业务问题点可以用OLAP去实现,通常情况下一个挖掘模型建立后应该采OLAP去验证这个业务模型是否有效。数据挖掘相当于知识的开采,在某些时候采用数据挖掘反而会适得其反。总之,在是否运用数据挖掘模型前,先要对业务问题进行充分的了解及评估,否则茫然建立挖掘模型即浪费时间又浪费金钱,最后只做了一个摆设。
   专业的数据挖掘只是充分了解业务“因子”后才能去衡量运用哪一种数据挖掘算法去实现它;无论在数据挖掘还是在OLAP及整个商业智能解决方案中其主要还是业务的理解,否则建立系统又不能对企业分析的作用。

作者: wyq21973   发布时间: 2005-03-18

接觸ORACLE已經三個月了,想向數據倉庫發展,看了幾個貼子還是不知所雲。呵呵,繼續

作者: winters2005   发布时间: 2005-03-18

数据仓库是所有应用的基础,不过前端应用,从即席查询、报表、OLAP到数据挖掘都应该了解嘛,呵呵。BTW,我就是主要在DW这块的,除数据挖掘外,其他也做过,不过倒想多了解下挖掘。

作者: china_Pate   发布时间: 2005-03-30

挖掘算法啊....

作者: yanglin2199   发布时间: 2005-12-12

UP!

作者: innovate511   发布时间: 2005-12-12

请问

这个数据挖掘高手 怎么定义

作者: anruky   发布时间: 2005-12-13

支持楼主!!!

作者: lululi   发布时间: 2005-12-13

本人也需做一个数据挖掘的论文,老板要我看看时间序列的数据挖掘,
还要我看看格兰杰协整理论,要我把这两个方法结合在一起,但现在我看了很长时间了,都没有什么收获,不知道有哪位看过这个的
指点一下,这两个理论怎么结合起来

作者: accelerator   发布时间: 2005-12-13

各位的分析都很有主见,不错

作者: heyatao   发布时间: 2005-12-25

不成熟才有机会,与传统数据库技术相比,这一新兴领域对广大中国IT从业者是一个难得的契机,毕竟我们与国外的差距还没有达到几十年。
     但是,这个领域充满机遇和挑战,就像当年的“炒股热”一样,当你看到机遇的时候,您也面对风险,先作好血本无归的心理准备,慎重思考后再作选择,毕竟它有可能将决定后半生的职业生涯!

作者: yangjie129   发布时间: 2005-12-27

学习中,欢迎发表自己的见解

作者: yangjie129   发布时间: 2005-12-27

支持 qdkx

作者: zhang_xincheng   发布时间: 2006-02-08

很赞同楼主的观点

作者: ioracle   发布时间: 2006-02-09

好帖  感谢上面的讨论   学习了

作者: domycase   发布时间: 2006-07-08