博客
关于我
事实表,维度,度量,指标之间的关系
阅读量:420 次
发布时间:2019-03-06

本文共 897 字,大约阅读时间需要 2 分钟。

数据仓库中的事实表是数据存储的基础,通常包含业务数据,如销售记录、用户行为等。与数据库中的表概念类似,事实表存储具体的数值型数据,确保数据具有可分析性。

1. 维度:描述数据特征

维度是数据的描述性属性,用于定义数据的分类维度。例如:

  • 地理位置维度:包括“城市名称”、“经纬度”等。
  • 用户属性维度:如“性别”、“年龄段”等。
  • 产品维度:如“产品类别”、“产品型号”等。

维度的值可以是具体的数据项,如“北京”、“男性”、“18-25岁”、“手机”等。通过定义不同的维度,可以全面描述数据的属性特征。

2. 指标:衡量数据价值

指标是基于维度的具体量化指标,用于衡量特定数据维度的量度。例如:

  • 人口维度的指标:如“人口数量”或“人口密度”。
  • 销售维度的指标:如“销售额”或“销售额增长率”。
  • 用户行为维度的指标:如“活跃度”或“留存率”。

指标通常需要结合度量字段进行计算,例如“收入增长率”需要用本月收入与上月收入进行比较。指标的设计需确保数据具有可比性和意义。

3. 度量:存储数据数值

度量是事实表中的数值型字段,用于存储具体的数据量化信息。度量字段需要统一单位,确保数据可汇总和比较。例如:

  • 人口数量:单位为“人”。
  • 销售额:单位为“元”或“美元”。
  • 用户活跃度:单位为“次/天”或“百分比”。

度量字段的数据类型通常为数值型,支持聚合操作,如求和、平均、最大值等。

4. 维度与指标的关系

维度和指标通常是相辅相成的:

  • 维度定义数据的分类维度。
  • 指标衡量维度的具体量度。
  • 通过组合多个维度和指标,可以构建复杂的分析模型。

例如,维度“城市”可以关联指标“人口”和“GDP”,进而构建“人口与GDP比率”等高级指标。

5. 指标与度量的区别

  • 度量:存储具体的数值数据,类似于“尺子”测量物体的长度。
  • 指标:衡量数据的相对程度,通常需要度量字段的计算支持。例如:
    • 收入增长率:(本月收入 - 上月收入) / 上月收入
    • 用户留存率:(当前月活跃用户数量 - 上月活跃用户数量) / 上月活跃用户数量

通过合理设计维度、指标和度量,可以构建一个完整的数据分析模型,支持深度的业务分析和决策支持。

转载地址:http://zhnuz.baihongyu.com/

你可能感兴趣的文章
NLP 项目:维基百科文章爬虫和分类【01】 - 语料库阅读器
查看>>
NLP_什么是统计语言模型_条件概率的链式法则_n元统计语言模型_马尔科夫链_数据稀疏(出现了词库中没有的词)_统计语言模型的平滑策略---人工智能工作笔记0035
查看>>
NLP学习笔记:使用 Python 进行NLTK
查看>>
NLP的神经网络训练的新模式
查看>>
NLP采用Bert进行简单文本情感分类
查看>>
NLP问答系统:使用 Deepset SQUAD 和 SQuAD v2 度量评估
查看>>
NLP:使用 SciKit Learn 的文本矢量化方法
查看>>
Nmap扫描教程之Nmap基础知识
查看>>
Nmap端口扫描工具Windows安装和命令大全(非常详细)零基础入门到精通,收藏这篇就够了
查看>>
NMAP网络扫描工具的安装与使用
查看>>
NMF(非负矩阵分解)
查看>>
nmon_x86_64_centos7工具如何使用
查看>>
NN&DL4.1 Deep L-layer neural network简介
查看>>
NN&DL4.3 Getting your matrix dimensions right
查看>>
NN&DL4.8 What does this have to do with the brain?
查看>>
nnU-Net 终极指南
查看>>
No 'Access-Control-Allow-Origin' header is present on the requested resource.
查看>>
NO 157 去掉禅道访问地址中的zentao
查看>>
no available service ‘default‘ found, please make sure registry config corre seata
查看>>
no connection could be made because the target machine actively refused it.问题解决
查看>>