关系型数据库的价值

获取持久化数据

并发

集成

企业级应用程序居于一个丰富的生态系统中，它需要与其他应用程序协同工作。不同的应用程序经常要使用同一份数据，而且某个应用程序更新完数据之后，必须让其他应用程序知道这份数据已经改变了。
常用的办法是使用共享数据库集成(shared database integration) ，多个应用程序都将数据保存在同一个数据库中。这样一来，所有应用程序很容易就能使用彼此的数据了。
与多用户访问单一应用程序时一样，数据库的并发控制机制也可以应对多个应用程序。

近乎标准的模型

由来

基于关系代数(relational algebra)，关系模型把数据组织成 “关系”(relation)和“元组”(tuple)。
- 元组是由“键值对”(name-value pair)构成的集合
- 而关系则是元组的集合。
- SQL操作所使用及返回的数据都是“关系”
- 元组不能包含“嵌套记录”(nested record)或“列表”(list) 等任何结构
而内存中的数据结构则无此限制，它可以使用的数据组织形式比“关系”更丰富。
关系模型和内存中的数据结构之间存在差异。这种现象通常称为“阻抗失谐”。
- 如果在内存中使用了较为丰富的数据结构，那么要把它保存到磁盘之前，必须先将其转换成“关系形式。于是就发生了“阻抗失谐”：需要在两种不同的表示形式之间转译

解决办法

存在查询性能问题和集成问题

把一组相互关联的对象视为一个整体单元来操作，而这个单元就叫聚合（aggregate）。

聚合无知

关系型数据库的数据模型中，没有“聚合”这一概念，因此我们称之为“聚合无知”(aggregate- ignorant)。

聚合反应数据操作的边界，很难在共享数据的多个场景中“正确” 划分，对某些数据交互有用的聚合结构，可能会阻碍另一些数据交互

在操作数据时，如果没有一种占主导地位的结构，那么选用此模型效果会更好。

聚合之间的关系

例如：把订单和客户放在两个聚合中，但是想在它们之间设定某种关系，以便能根据订单查出客户数据。

操作多个有关联的聚合，由应用保证其正确性

聚合、集群和事务处理

在集群上运行时，需要把采集数据时所需的节点数降至最小

通常情况下，面向聚合的数据库不支持跨越多个聚合的ACID事务。它每次只能在一个聚合结构上执行原子操作。

这两类数据库都包含大量聚合，每个聚合中都有一个获取数据所用的键或ID。

两种模型的区别是:

键值数据库的聚合不透明，只包含一些没有太多意义的大块信息
- 聚合中可以存储任意数据。数据库可能会限制聚合的总大小，但除此之外，其他方面都很随意
- 在键值数据库中，要访问聚合内容，只能通过键来查找
在文档数据库的聚合中，可以看到其结构。
- 限制其中存放的内容，它定义了其允许的结构与数据类型
- 能够更加灵活地访问数据。通过用聚合中的字段查询，可以只获取一部分聚合，而不用获取全部内容
- 可以按照聚合内容创建索引