MySQL数据库
在网站开发中,数据库是网站的重要组成部分。只有提供数据库,数据才能够动态的展示,而不是在网页中显示一个静态的页面。数据库有很多,比如有SQL Server
、Oracle
、PostgreSQL
以及MySQL
等等。MySQL
由于价格实惠、简单易用、不受平台限制、灵活度高等特性,目前已经取得了绝大多数的市场份额。因此我们在Django
中,也是使用MySQL
来作为数据存储。
数据库相关软件
MySQL数据库安装
- 在
MySQL
的官网下载MySQL
数据库安装文件:https://dev.mysql.com/downloads/windows/installer/5.7.html
。 - 然后双击安装,如果出现以下错误,则到
http://www.microsoft.com/en-us/download/details.aspx?id=17113
下载.net framework
。 - 在安装过程中,如果提示没有
Microsoft C++ 2013
,那么就到以下网址下载安装即可:http://download.microsoft.com/download/9/0/5/905DBD86-D1B8-4D4B-8A50-CB0E922017B9/vcredist_x64.exe
。 - 接下来就是做好用户名和密码的配置即可。
navicat数据库操作软件
安装完MySQL
数据库以后,就可以使用MySQL
提供的终端客户端软件来操作数据库。如下: 这个软件所有的操作都是基于sql
语言,对于想要熟练sql
语言的同学来讲是非常合适的。但是对于在企业中可能不是一款好用的工具。在企业中我们推荐使用mysql workbench
以及navicat
这种图形化操作的软件。而mysql workbench
是mysql
官方提供的一个免费的软件,正因为是免费,所以在一些功能上不及navicat
。navicat for mysql
是一款收费的软件。官网地址如下:https://www.navicat.com.cn/products
。
MySQL驱动程序安装
我们使用Django
来操作MySQL
,实际上底层还是通过Python
来操作的。因此我们想要用Django
来操作MySQL
,首先还是需要安装一个驱动程序。在Python3
中,驱动程序有多种选择。比如有pymysql
以及mysqlclient
等。这里我们就使用mysqlclient
来操作。mysqlclient
安装非常简单。只需要通过pip install mysqlclient
即可安装。
常见MySQL
驱动介绍:
MySQL-python
:也就是MySQLdb
。是对C
语言操作MySQL
数据库的一个简单封装。遵循了Python DB API v2
。但是只支持Python2
,目前还不支持Python3
。mysqlclient
:是MySQL-python
的另外一个分支。支持Python3
并且修复了一些bug
。pymysql
:纯Python
实现的一个驱动。因为是纯Python
编写的,因此执行效率不如MySQL-python
。并且也因为是纯Python
编写的,因此可以和Python
代码无缝衔接。MySQL Connector/Python
:MySQL
官方推出的使用纯Python
连接MySQL
的驱动。因为是纯Python
开发的。效率不高。
数据库操作
Django配置连接数据库
在操作数据库之前,首先先要连接数据库。这里我们以配置MySQL
为例来讲解。Django
连接数据库,不需要单独的创建一个连接对象。只需要在settings.py
文件中做好数据库相关的配置就可以了。示例代码如下:
DATABASES = {
'default': {
# 数据库引擎(是mysql还是oracle等)
'ENGINE': 'django.db.backends.mysql',
# 数据库的名字
'NAME': 'mysql',
# 连接mysql数据库的用户名
'USER': 'root',
# 连接mysql数据库的密码
'PASSWORD': 'root',
# mysql数据库的主机地址
'HOST': '127.0.0.1',
# mysql数据库的端口号
'PORT': '3306',
}
}
在Django中操作数据库
在Django
中操作数据库有两种方式。第一种方式就是使用原生sql
语句操作,第二种就是使用ORM
模型来操作。
在Django
中使用原生sql
语句操作其实就是使用python db api
的接口来操作。如果你的mysql
驱动使用的是pymysql
,那么你就是使用pymysql
来操作的,只不过Django
将数据库连接的这一部分封装好了,我们只要在settings.py
中配置好了数据库连接信息后直接使用Django
封装好的接口就可以操作了。示例代码如下:
# 使用django封装好的connection对象,会自动读取settings.py中数据库的配置信息
from django.db import connection
# 获取游标对象
cursor = connection.cursor()
# 拿到游标对象后执行sql语句
cursor.execute("select * from book")
# 获取所有的数据
rows = cursor.fetchall()
# 遍历查询到的数据
for row in rows:
print(row)
以上的execute
以及fetchall
方法都是Python DB API
规范中定义好的。任何使用Python
来操作MySQL
的驱动程序都应该遵循这个规范。所以不管是使用pymysql
或者是mysqlclient
或者是mysqldb
,他们的接口都是一样的。更多规范请参考:https://www.python.org/dev/peps/pep-0249/。
Python DB API下规范下cursor对象常用接口
-
description
:如果cursor
执行了查询的sql
代码。那么读取cursor.description
属性的时候,将返回一个列表,这个列表中装的是元组,元组中装的分别是(name,type_code,display_size,internal_size,precision,scale,null_ok)
,其中name
代表的是查找出来的数据的字段名称,其他参数暂时用处不大。 -
rowcount
:代表的是在执行了sql
语句后受影响的行数。 -
close
:关闭游标。关闭游标以后就再也不能使用了,否则会抛出异常。 -
execute(sql[,parameters])
:执行某个sql
语句。如果在执行sql
语句的时候还需要传递参数,那么可以传给parameters
参数。示例代码如下:cursor.execute("select * from article where id=%s",(1,))
-
fetchone
:在执行了查询操作以后,获取第一条数据。 -
fetchmany(size)
:在执行查询操作以后,获取多条数据。具体是多少条要看传的size
参数。如果不传size
参数,那么默认是获取第一条数据。 -
fetchall
:获取所有满足sql
语句的数据。
ORM模型介绍
随着项目越来越大,采用写原生SQL的方式在代码中会出现大量的SQL语句,那么问题就出现了:
- SQL语句重复利用率不高,越复杂的SQL语句条件越多,代码越长。会出现很多相近的SQL语句。
- 很多SQL语句是在业务逻辑中拼出来的,如果有数据库需要更改,就要去修改这些逻辑,这会很容易漏掉对某些SQL语句的修改。
- 写SQL时容易忽略web安全问题,给未来造成隐患。SQL注入。
ORM
,全称Object Relational Mapping
,中文叫做对象关系映射,通过ORM
我们可以通过类的方式去操作数据库,而不用再写原生的SQL语句。通过把表映射成类,把行作实例,把字段作为属性,ORM
在执行对象操作的时候最终还是会把对应的操作转换为数据库原生语句。使用ORM
有许多优点:
-
易用性:使用
ORM
做数据库的开发可以有效的减少重复SQL语句的概率,写出来的模型也更加直观、清晰。 -
性能损耗小:
ORM
转换成底层数据库操作指令确实会有一些开销。但从实际的情况来看,这种性能损耗很少(不足5%),只要不是对性能有严苛的要求,综合考虑开发效率、代码的阅读性,带来的好处要远远大于性能损耗,而且项目越大作用越明显。 -
设计灵活:可以轻松的写出复杂的查询。
-
可移植性:
Django
封装了底层的数据库实现,支持多个关系数据库引擎,包括流行的MySQL
、PostgreSQL
和SQLite
。可以非常轻松的切换数据库。
创建ORM模型
ORM
模型一般都是放在app
的models.py
文件中。每个app
都可以拥有自己的模型。并且如果这个模型想要映射到数据库中,那么这个app
必须要放在settings.py
的INSTALLED_APP
中进行安装。以下是写一个简单的书籍ORM
模型。示例代码如下:
from django.db import models
class Book(models.Model):
name = models.CharField(max_length=20,null=False)
author = models.CharField(max_length=20,null=False)
pub_time = models.DateTimeField(default=datetime.now)
price = models.FloatField(default=0)
以上便定义了一个模型。这个模型继承自django.db.models.Model
,如果这个模型想要映射到数据库中,就必须继承自这个类。这个模型以后映射到数据库中,表名是模型名称的小写形式,为book
。在这个表中,有四个字段,一个为name
,这个字段是保存的是书的名称,是varchar
类型,最长不能超过20个字符,并且不能为空。第二个字段是作者名字类型,同样也是varchar
类型,长度不能超过20个。第三个是出版时间,数据类型是datetime
类型,默认是保存这本书籍的时间。第五个是这本书的价格,是浮点类型。 还有一个字段我们没有写,就是主键id
,在django
中,如果一个模型没有定义主键,那么将会自动生成一个自增长的int
类型的主键,并且这个主键的名字就叫做id
。
映射模型到数据库中
将ORM
模型映射到数据库中,总结起来就是以下几步:
- 在
settings.py
中,配置好DATABASES
,做好数据库相关的配置。 - 在
app
中的models.py
中定义好模型,这个模型必须继承自django.db.models
。 - 将这个
app
添加到settings.py
的INSTALLED_APP
中。 - 在命令行终端,进入到项目所在的路径,然后执行命令
python manage.py makemigrations
来生成迁移脚本文件。 - 同样在命令行中,执行命令
python manage.py migrate
来将迁移脚本文件映射到数据库中。
模型常用字段属性
在Django
中,定义了一些Field
来与数据库表中的字段类型来进行映射。以下将介绍那些常用的字段类型。
1.AutoField
映射到数据库中是int
类型,可以有自动增长的特性。一般不需要使用这个类型,如果不指定主键,那么模型会自动的生成一个叫做id
的自动增长的主键。如果你想指定一个其他名字的并且具有自动增长的主键,使用AutoField
也是可以的。
2.BigAutoField
64位的整形,类似于AutoField
,只不过是产生的数据的范围是从1-9223372036854775807
。
3.BooleanField
在模型层面接收的是True/False
。在数据库层面是tinyint
类型。如果没有指定默认值,默认值是None
。
4.CharField
在数据库层面是varchar
类型。在Python
层面就是普通的字符串。这个类型在使用的时候必须要指定最大的长度,也即必须要传递max_length
这个关键字参数进去。
5.DateField
日期类型。在Python
中是datetime.date
类型,可以记录年月日。在映射到数据库中也是date
类型。使用这个Field
可以传递以下几个参数:
-
auto_now
:在每次这个数据保存的时候,都使用当前的时间。比如作为一个记录修改日期的字段,可以将这个属性设置为True
。 -
auto_now_add
:在每次数据第一次被添加进去的时候,都使用当前的时间。比如作为一个记录第一次入库的字段,可以将这个属性设置为True
。
6.DateTimeField
日期时间类型,类似于DateField
。不仅仅可以存储日期,还可以存储时间。映射到数据库中是datetime
类型。这个Field
也可以使用auto_now
和auto_now_add
两个属性。
7.TimeField
时间类型。在数据库中是time
类型。在Python
中是datetime.time
类型。
8.EmailField
类似于CharField
。在数据库底层也是一个varchar
类型。最大长度是254个字符。
9.FileField
用来存储文件的。
9.ImageField
用来存储图片文件的。
10.FloatField
浮点类型。映射到数据库中是float
类型。
11.IntegerField
整形。值的区间是-2147483648——2147483647
。
12.BigIntegerField
大整形。值的区间是-9223372036854775808——9223372036854775807
。
13.PositiveIntegerField
正整形。值的区间是0——2147483647
。
14.SmallIntegerField
小整形。值的区间是-32768——32767
。
15.PositiveSmallIntegerField
正小整形。值的区间是0——32767
。
16.TextField
大量的文本类型。映射到数据库中是longtext
类型。
17.UUIDField
只能存储uuid
格式的字符串。uuid
是一个32位的全球唯一的字符串,一般用来作为主键。
18.URLField
类似于CharField
,只不过只能用来存储url
格式的字符串。并且默认的max_length
是200。
Field的常用参数
1. null
如果设置为True
,Django
将会在映射表的时候指定是否为空。默认是为False
。在使用字符串相关的Field
(CharField/TextField
)的时候,官方推荐尽量不要使用这个参数,也就是保持默认值False
。因为Django
在处理字符串相关的Field
的时候,即使这个Field
的null=False
,如果你没有给这个Field
传递任何值,那么Django
也会使用一个空的字符串""
来作为默认值存储进去。因此如果再使用null=True
,Django
会产生两种空值的情形(NULL或者空字符串)。如果想要在表单验证的时候允许这个字符串为空,那么建议使用blank=True
。如果你的Field
是BooleanField
,那么对应的可空的字段则为NullBooleanField
。
2.blank
标识这个字段在表单验证的时候是否可以为空。默认是False
。 这个和null
是有区别的,null
是一个纯数据库级别的。而blank
是表单验证级别的。
3.db_column
这个字段在数据库中的名字。如果没有设置这个参数,那么将会使用模型中属性的名字。
4.default
默认值。可以为一个值,或者是一个函数,但是不支持lambda
表达式。并且不支持列表/字典/集合等可变的数据结构。
5.primary_key
是否为主键。默认是False
。
6.unique
在表中这个字段的值是否唯一。一般是设置手机号码/邮箱等。
更多Field
参数请参考官方文档:https://docs.djangoproject.com/zh-hans/2.0/ref/models/fields/
模型中Meta
配置
对于一些模型级别的配置。我们可以在模型中定义一个类,叫做Meta
。然后在这个类中添加一些类属性来控制模型的作用。比如我们想要在数据库映射的时候使用自己指定的表名,而不是使用模型的名称。那么我们可以在Meta
类中添加一个db_table
的属性。示例代码如下:
class Book(models.Model):
name = models.CharField(max_length=20,null=False)
desc = models.CharField(max_length=100,name='description',db_column="description1")
class Meta:
db_table = 'book_model'
以下将对Meta
类中的一些常用配置进行解释。
db_table
这个模型映射到数据库中的表名。如果没有指定这个参数,那么在映射的时候将会使用模型名来作为默认的表名。
ordering
设置在提取数据的排序方式。后面章节会讲到如何查找数据。比如我想在查找数据的时候根据添加的时间排序,那么示例代码如下:
class Book(models.Model):
name = models.CharField(max_length=20,null=False)
desc = models.CharField(max_length=100,name='description',db_column="description1")
pub_date = models.DateTimeField(auto_now_add=True)
class Meta:
db_table = 'book_model'
ordering = ['pub_date']
更多的配置参考官方文档:
https://docs.djangoproject.com/en/2.0/ref/models/options/
外键和表关系
外键
在MySQL
中,表有两种引擎,一种是InnoDB
,另外一种是myisam
。如果使用的是InnoDB
引擎,是支持外键约束的。外键的存在使得ORM
框架在处理表关系的时候异常的强大。因此这里我们首先来介绍下外键在Django
中的使用。
类定义为class ForeignKey(to,on_delete,**options)
。第一个参数是引用的是哪个模型,第二个参数是在使用外键引用的模型数据被删除了,这个字段该如何处理,比如有CASCADE
、SET_NULL
等。这里以一个实际案例来说明。比如有一个User
和一个Article
两个模型。一个User
可以发表多篇文章,一个Article
只能有一个Author
,并且通过外键进行引用。那么相关的示例代码如下:
class User(models.Model):
username = models.CharField(max_length=20)
password = models.CharField(max_length=100)
class Article(models.Model):
title = models.CharField(max_length=100)
content = models.TextField()
author = models.ForeignKey("User",on_delete=models.CASCADE)
以上使用ForeignKey
来定义模型之间的关系。即在article
的实例中可以通过author
属性来操作对应的User
模型。这样使用起来非常的方便。示例代码如下:
article = Article(title='abc',content='123')
author = User(username='张三',password='111111')
article.author = author
article.save()
# 修改article.author上的值
article.author.username = '李四'
article.save()
为什么使用了ForeignKey
后,就能通过author
访问到对应的user
对象呢。因此在底层,Django
为Article
表添加了一个属性名_id
的字段(比如author的字段名称是author_id),这个字段是一个外键,记录着对应的作者的主键。以后通过article.author
访问的时候,实际上是先通过author_id
找到对应的数据,然后再提取User
表中的这条数据,形成一个模型。
如果想要引用另外一个app
的模型,那么应该在传递to
参数的时候,使用app.model_name
进行指定。以上例为例,如果User
和Article
不是在同一个app
中,那么在引用的时候的示例代码如下:
# User模型在user这个app中
class User(models.Model):
username = models.CharField(max_length=20)
password = models.CharField(max_length=100)
# Article模型在article这个app中
class Article(models.Model):
title = models.CharField(max_length=100)
content = models.TextField()
author = models.ForeignKey("user.User",on_delete=models.CASCADE)
如果模型的外键引用的是本身自己这个模型,那么to
参数可以为'self'
,或者是这个模型的名字。在论坛开发中,一般评论都可以进行二级评论,即可以针对另外一个评论进行评论,那么在定义模型的时候就需要使用外键来引用自身。示例代码如下:
class Comment(models.Model):
content = models.TextField()
origin_comment = models.ForeignKey('self',on_delete=models.CASCADE,null=True)
# 或者
# origin_comment = models.ForeignKey('Comment',on_delete=models.CASCADE,null=True)
外键删除操作
如果一个模型使用了外键。那么在对方那个模型被删掉后,该进行什么样的操作。可以通过on_delete
来指定。可以指定的类型如下:
CASCADE
:级联操作。如果外键对应的那条数据被删除了,那么这条数据也会被删除。PROTECT
:受保护。即只要这条数据引用了外键的那条数据,那么就不能删除外键的那条数据。SET_NULL
:设置为空。如果外键的那条数据被删除了,那么在本条数据上就将这个字段设置为空。如果设置这个选项,前提是要指定这个字段可以为空。SET_DEFAULT
:设置默认值。如果外键的那条数据被删除了,那么本条数据上就将这个字段设置为默认值。如果设置这个选项,前提是要指定这个字段一个默认值。SET()
:如果外键的那条数据被删除了。那么将会获取SET
函数中的值来作为这个外键的值。SET
函数可以接收一个可以调用的对象(比如函数或者方法),如果是可以调用的对象,那么会将这个对象调用后的结果作为值返回回去。DO_NOTHING
:不采取任何行为。一切全看数据库级别的约束。
以上这些选项只是Django级别的,数据级别依旧是RESTRICT!
表关系
表之间的关系都是通过外键来进行关联的。而表之间的关系,无非就是三种关系:一对一、一对多(多对一)、多对多等。以下将讨论一下三种关系的应用场景及其实现方式。
一对多
-
应用场景:比如文章和作者之间的关系。一个文章只能由一个作者编写,但是一个作者可以写多篇文章。文章和作者之间的关系就是典型的多对一的关系。
-
实现方式:一对多或者多对一,都是通过
ForeignKey
来实现的。还是以文章和作者的案例进行讲解。class User(models.Model): username = models.CharField(max_length=20) password = models.CharField(max_length=100) class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() author = models.ForeignKey("User",on_delete=models.CASCADE)
那么以后在给
Article
对象指定author
,就可以使用以下代码来完成:article = Article(title='abc',content='123') author = User(username='tangwenjie',password='111111') # 要先保存到数据库中 author.save() article.author = author article.save()
并且以后如果想要获取某个用户下所有的文章,可以通过
article_set
来实现。示例代码如下:user = User.objects.first() # 获取第一个用户写的所有文章 articles = user.article_set.all() for article in articles: print(article)
一对一
-
应用场景:比如一个用户表和一个用户信息表。在实际网站中,可能需要保存用户的许多信息,但是有些信息是不经常用的。如果把所有信息都存放到一张表中可能会影响查询效率,因此可以把用户的一些不常用的信息存放到另外一张表中我们叫做
UserExtension
。但是用户表User
和用户信息表UserExtension
就是典型的一对一了。 -
实现方式:
Django
为一对一提供了一个专门的Field
叫做OneToOneField
来实现一对一操作。示例代码如下:class User(models.Model): username = models.CharField(max_length=20) password = models.CharField(max_length=100) class UserExtension(models.Model): birthday = models.DateTimeField(null=True) school = models.CharField(blank=True,max_length=50) user = models.OneToOneField("User", on_delete=models.CASCADE)
在
UserExtension
模型上增加了一个一对一的关系映射。其实底层是在UserExtension
这个表上增加了一个user_id
,来和user
表进行关联,并且这个外键数据在表中必须是唯一的,来保证一对一。
多对多
-
应用场景:比如文章和标签的关系。一篇文章可以有多个标签,一个标签可以被多个文章所引用。因此标签和文章的关系是典型的多对多的关系。
-
实现方式:
Django
为这种多对多的实现提供了专门的Field
。叫做ManyToManyField
。还是拿文章和标签为例进行讲解。示例代码如下:class Article(models.Model): title = models.CharField(max_length=100) content = models.TextField() tags = models.ManyToManyField("Tag",related_name="articles") class Tag(models.Model): name = models.CharField(max_length=50)
在数据库层面,实际上
Django
是为这种多对多的关系建立了一个中间表。这个中间表分别定义了两个外键,引用到article
和tag
两张表的主键。
related_name和related_query_name
related_name
还是以User
和Article
为例来进行说明。如果一个article
想要访问对应的作者,那么可以通过author
来进行访问。但是如果有一个user
对象,想要通过这个user
对象获取所有的文章,该如何做呢?这时候可以通过user.article_set
来访问,这个名字的规律是模型名字小写_set
。示例代码如下:
user = User.objects.get(name='张三')
user.article_set.all()
如果不想使用模型名字小写_set
的方式,想要使用其他的名字,那么可以在定义模型的时候指定related_name
。示例代码如下:
class Article(models.Model):
title = models.CharField(max_length=100)
content = models.TextField()
# 传递related_name参数,以后在方向引用的时候使用articles进行访问
author = models.ForeignKey("User",on_delete=models.SET_NULL,null=True,related_name='articles')
以后在方向引用的时候。使用articles
可以访问到这个作者的文章模型。示例代码如下:
user = User.objects.get(name='张三')
user.articles.all()
如果不想使用反向引用,那么可以指定related_name='+'
。示例代码如下:
class Article(models.Model):
title = models.CharField(max_length=100)
content = models.TextField()
# 传递related_name参数,以后在方向引用的时候使用articles进行访问
author = models.ForeignKey("User",on_delete=models.SET_NULL,null=True,related_name='+')
以后将不能通过user.article_set
来访问文章模型了。
related_query_name
在查找数据的时候,可以使用filter
进行过滤。使用filter
过滤的时候,不仅仅可以指定本模型上的某个属性要满足什么条件,还可以指定相关联的模型满足什么属性。比如现在想要获取写过标题为abc
的所有用户,那么可以这样写:
users = User.objects.filter(article__title='abc')
如果你设置了related_name
为articles
,因为反转的过滤器的名字将使用related_name
的名字,那么上例代码将改成如下:
users = User.objects.filter(articles__title='abc')
可以通过related_query_name
将查询的反转名字修改成其他的名字。比如article
。示例代码如下:
class Article(models.Model):
title = models.CharField(max_length=100)
content = models.TextField()
# 传递related_name参数,以后在方向引用的时候使用articles进行访问
author = models.ForeignKey("User",on_delete=models.SET_NULL,null=True,related_name='articles',related_query_name='article')
那么在做反向过滤查找的时候就可以使用以下代码:
users = User.objects.filter(article__title='abc')
来源:oschina
链接:https://my.oschina.net/u/4258502/blog/4089098