数据处理大致分为两类:
1. OLTP(On-Line Transaction Processing) :联机事务处理,这是一种操作型处理,是传统的关系型数据库的主要应用。
2. OLAP(On-Line Analytical Processing):联机分析处理,这是一种分析型处理,是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
数据仓库(Data Warehouse)是一个
面向主题的(Subject Oriented)、
集成的(Integrated)、
相对稳定的(Non-Volatile)、
反映历史变化(Time Variant)的数据集合,
用于支持管理决策(Decision Making Support)。
主要区别:
1. 数据库是面向事务的设计;数据仓库是面向主题的设计。
2. 数据库设计是尽量避免冗余,一般采用符合三范式(1NF:列不可分割,2NF:行必须有主键,3NF:避免字段冗余)的规则来设计;数据仓库在设计是有意引入冗余,采用反范式的方式来设计。
3. 数据库是为捕获数据而设计,数据仓库是为分析数据而设计。
4. 在实现上,数据库通常使用行式存储(MySQL,Oracle),数据仓库倾向使用列式存储(HBase,SAP IQ)。
5. 数据库中的数据会实时变化,数据仓库中的数据相对稳定,查询为主。
|