事务的由来以及aid保证一致性(状态总是正确的)

我怕爱的太早我们不能终老 提交于 2020-02-17 15:03:54

首先,我们需要搞清楚为什么会出现事务.

Transactions are not a law of nature; they were created with a purpose, namely to simplify the programming model for applications accessing a database. By using transactions, the application is free to ignore certain potential error scenarios and concurrency issues, because the database takes care of them instead (we call these safety guarantees).

这句话的大体含义就是,事务的产生,其实是为了当应用程序访问数据库的时候,事务能够简化我们的编程模型,不需要我们去考虑各种各样的潜在错误和并发问题.可以想一下当我们使用事务时,要么提交,要么回滚,我们不会去考虑网络异常了,服务器宕机了,同时更改一个数据怎么办对吧?

题外话: 因此事务本质上是为了应用层服务的.而不是伴随着数据库系统天生就有的.其次,说道一致性,很遗憾,这个词在不同的环境下有着不同的含义,被极大的滥用了,导致很难理解:1. 多副本的一致性2. 一致性hash.3. CAP理论的一致性4. ACID里的一致性而这几个一致性的含义都不是一回事!不是一回事!不是一回事!所有提到最终一致性,一致读的回答,都是不对的,那是CAP里面C的含义,具体可以搜索查询Linearizability 这个词的含义,这个并不是今天的重点.然后回到问题!!!

ACID,可以简化问题单机场景下事务里一致性的含义,为什么不讨论分布式呢?因为既然一个分布式数据库提供了ACID事务保证,那么你把它看做单机又何妨呢?它是如何做到如同单机一般的,我们根本不需要关心啊.所以只考虑单机能够简化思维.

ACID里的AID都是数据库的特征,也就是依赖数据库的具体实现.而唯独这个C,实际上它依赖于应用层,也就是依赖于开发者.这里的一致性是指系统从一个正确的状态,迁移到另一个正确的状态.什么叫正确的状态呢?就是当前的状态满足预定的约束就叫做正确的状态.而事务具备ACID里C的特性是说通过事务的AID来保证我们的一致性.做个比喻事务就好比一个保镖,我们提到事务就会说ACID,而我们提到保镖会说强壮,保护安全,好功夫,踏实.这里强壮,好功夫和踏实都是保镖自己的特征,而安全是属于你的,而你通过保镖的特征来保护你的安全.但是这里必须注意,我们能够通过AID保证我们的一致性,但事务本身没办法确保.用上面保镖的例子来说,你正常被保护一定是安全的,但是你故意骗保镖离开你身边,然后你自己溜出去玩.同样,如果你在事务里故意写出违反约束的代码,比如银行系统定时每天给自己的账户打入100w,这个事务是没办法的.

这里我们举个大家都在说的财务系统的例子.A要向B支付100元,而A的账户中只有90元,并且我们给定账户余额这一列的约束是,不能小于0.那么很明显这条事务执行会失败,因为90-100=-10,小于我们给定的约束了.这个例子里,支付之前我们数据库里的数据都是符合约束的,但是如果事务执行成功了,我们的数据库数据就破坏约束了,因此事务不能成功,这里我们说事务提供了一致性的保证.然后我们再看个例子A要向B支付100元,而A的账户中只有90元,我们的账户余额列没有任何约束.但是我们业务上不允许账户余额小于0.因此支付完成后我们会检查A的账户余额,发现余额小于0了,于是我们进行了事务的回滚.

这个例子里,如果事务执行成功,虽然没有破坏数据库的约束,但是破坏了我们应用层的约束.而事务的回滚保证了我们的约束,因此也可以说事务提供了一致性保证(ps:事实上,是我们应用层利用事务回滚保证了我们的约束不被破坏).

最后我们再看个例子A要向B支付100元,而A的账户中只有90元,我们的账户余额列没有任何约束.然后支付成功了.这里,如果按照很多人的理解,事务不是保证一致性么?直观上账户余额为什么能为负呢.但这里事务执行前和执行后,我们的系统没有任何的约束被破坏.一直都是保持正确的状态.所以,综上.你可以理解一致性就是:应用系统从一个正确的状态到另一个正确的状态.而ACID就是说事务能够通过AID来保证这个C的过程.C是目的,AID都是手段.

steven: 为了确保一致性(系统故障/并发修改也是数据正确, 或者满足人为额外约束), 需要有回滚的动作, 可以理解为在提交之前检查一下是否没有发生故障并且满足约束, 再提交. 所以在事务执行前后数据都是正确的, 但是执行过程中可能会破坏数据的正确性, 一旦破坏就回滚, 所以事务之间应当隔离(站在数据一致性的角度),不应该让其他线程访问到别的事务内部在执行过程中的数据, 一旦访问到那访问的数据就可能不是在正确状态的 隔离级别是在不同程度上不同情况下破坏一致性而提高效率, 对牺牲一部分一致性的容忍程度)

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!