宽表、窄表是大数据中的概念
宽表,字段比较多的数据库表。将业务主题相关的多个维度的字段关联在一起的一张数据库表。
宽表的本质:以空间换时间
好处:
- 统一口径
- 降低统计难度,减少表之间的关联
- 节省跑数时间
- 节省资源
窄表,符合三范式,相同维度的字段组成一张表。表和表之间关联查询。
横表、纵表
横表:也称为行表,将数据按照行进行排列。
纵表:也称为列式表或属性表,将数据按照列进行排列。
横表
ID | 英语 | 数学 | 体育 | 物理 |
---|---|---|---|---|
1 | 99 | 100 | 100 | 99 |
- 优点:结构清晰,业务逻辑描述清楚;数据量小
- 缺点:字段固定,不便于存储;增加字段要改表结构
纵表
ID | 科目/datatype | 成绩/value |
---|---|---|
1 | 英语 | 99 |
2 | 数学 | 100 |
3 | 体育 | 100 |
4 | 物理 | 99 |
- 优点:可变字段存储容易
- 缺点:数据量大;表结构对业务描述不清晰