几种特殊类型的维度

–退化维度(Degenerate Dimension)
最常见的例子为“定单号”、“话单流水号”等字段,其本身没有太多的含义,但在事实表中又丌做为度量数据。我们丌必建立一个相关的维度表,只是单纯的保留这个字段,因此被称为退化维度。它在同OLTP系统交互、数据质量等方面有很大作用。

–角色扮演维度(Role-Play Dimension)
以日期维度为例,在同一事实表中可能存在多个需要分析的日期,如话单中的“系统处理日期”和“话单日期”。对于用户而言,如果只有一个日期维度,就会造成理解上的歧义。因此,通常是至少在逡辑上将这些维度复制成丌同“角色”的维度。

–垃圾维度(Junk Dimension)
某些事实表中,存在一些无法成为正常的维度又丌能成为度量信息的字段,比如“remark”乊类的字段。被称乊为垃圾维度。处理这些垃圾字段时,尽量避免
==》单纯的保留在事实表中,以免造成存储上的浪费和效率上的降低
==》每一个字段都建立一个维度,这会使的事实表过大,而过多的维度会造成查询效率的降低
==》在事实表中删除这些信息,除非能在业务上确讣其无效
    比较好的处理办法是将几个字段组合建立一个戒几个简化的维度

作者: wangfans   发布时间: 2011-06-01

忘记了KIMBALL是否提到创新型维度,就是业务系统中没有现成的数据,但在业务中客观存在的分析角度。

例如电子商务里的客户访问路径、客户生命周期等,这些业务系统都没现成的数据和业务定义。

作者: innovate511   发布时间: 2011-06-01



QUOTE:原帖由 innovate511 于 2011-6-1 17:42 发表
忘记了KIMBALL是否提到创新型维度,就是业务系统中没有现成的数据,但在业务中客观存在的分析角度。

例如电子商务里的客户访问路径、客户生命周期等,这些业务系统都没现成的数据和业务定义。

没看到过这个说法,哪里有相关资料啊?

[ 本帖最后由 wangfans 于 2011-6-1 17:53 编辑 ]

作者: wangfans   发布时间: 2011-06-01



QUOTE:原帖由 wangfans 于 2011-6-1 17:50 发表


没看到过这个说法,难道DW 2.0里面有介绍?

没有,我自己想到的问题。DW 2.0更加不会介绍,那是偏技术的。我说的是对业务的深度抽象,根据行业业务本身的特点,衍生出来的维,这样的维度是需要专门ETL出来的,这个已经涉及到超越数据模型范围的业务模型了。 先有业务模型,才能将思想融入数据模型,然后就是根据建模技术特点,在数据模型中落地。

作者: innovate511   发布时间: 2011-06-01