@(数据结构绪论)
1.数据结构的起源
==数据结构==是一门研究非数值计算的程序设计问题中的操作对象以及它们之间的关系和操作等相关问题的学科。
1968年,美国的高德纳(Donald E.Knuth)的《计算机程序设计艺术》第一卷《基本语法》中,较系统地阐述了数据的逻辑结构和存储结构及其操作,开创了数据结构的课程体系。同年(1968年),数据结构作为一门独立的课程,在计算机科学的学位课程中开始出现。
程序设计 = 数据结构 + 算法
2.基本概念和术语
==数据==:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。
数据不仅仅包括整型、实型等数值类型,还包括字符及声音、图像、视频等非数值类型
它是计算机程序加工的“原料”。例如,一个利用数值分析方法解代数方程的程序,其处理对象是整数和实数。一个编译程序或文字处理程序的处理对象是字符串。
数据,其实就是符号 ,并且具备两个前提
- 可以输入到计算机中。
- 能被计算机程序处理。
数值类型可以进行数值计算。
字符类型需要进行非数值的处理。而声音、图像、视频等是通过编码的手段变成字符数据来处理的。
==数据元素==:是组成数据的、有一定意义的基本单位 ,在计算机中通常作为整体处理。也被称为记录。
比如,人类的数据元素就是 人,畜类的数据元素就是 牛、马、羊、鸡等。
==数据项==:一个数据元素可以由若干个数据项组成。
比如 人 这个数据元素,有眼、耳、鼻、手等数据项,也有姓名、年龄、性别等数据项。
数据项是数据不可分割的最小单位。但真正讨论问题时,数据元素才是数据结构中建立数据模型的着眼点(比如讨论一部电影时,是讨论电影角色这样的“数据元素”,而不是针对这个角色的姓名或者年龄这样的“数据项”去研究分析)。
==数据对象==:是性质相同的数据元素的集合,是数据的子集。
性质相同,指的是数据元素具有相同数量和类型的数据项,比如人都有姓名、生日、性别等相同的数据项。
处理的数据元素通常具有相同性质,在不产生混淆的情况下,我们都将数据对象简称为数据。
==数据结构==:是相互之间存在一种或多种特定关系的数据元素的集合。
在任何问题中,数据元素都不是孤立存在的,而是存在特定的关系,我们将这些关系称为结构,比如不同物质的原子之间排列的顺序不同。
在计算机中,数据元素并不是孤立、杂乱无序的,而是具有内在联系的数据集合。数据元素之间存在的一种或多种特定关系,也就是数据的组织形式。
3.逻辑结构与物理结构
==逻辑结构==:是指数据对象中数据元素之间的相互关系。
逻辑结构可分为以下四种:
1. 集合结构
集合结构:集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系。
各个数据元素是“平等”的,他们的共同属性是“同属于一个集合”。数据结构中的集合关系就类似于数学中的集合。如图所示:
2. 线性结构
线性结构:线性结构中的数据元素之间是一对一的关系。
如图所示:
3. 树形结构
树形结构:树形结构中的数据元素之间存在一种一对多的层次关系。
如二叉树:
4. 图形结构
图形结构:图形结构的数据元素是多对多的关系。
如图所示:
==物理结构(存储结构)==:是指数据的逻辑结构在计算机中的存储形式
即如何把数据元素存储到计算机的存储器中。存储器主要是针对内存而言的,像硬盘、软盘、光盘等外部存储器的数据组织通常用文件结构来描述。
数据的存储结构应正确反映数据元素之间的逻辑关系,这才是最为关键的,如何存储数据元素之间的逻辑关系,是实现物理结构的重点和难点。
物理(存储)结构可分为以下两种:
1. 顺序存储结构
顺序存储结构:是把数据元素存放在地址连续的存储单元中,其数据间的逻辑关系和物理关系是一致的。如图所示:
可以理解为一个接一个的排队
2. 链式存储结构
链式存储结构:是把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。
数据元素的存储关系并不能反映其逻辑关系,因此需要用一个指针存放数据元素的地址,这样通过地址就可以找到相关联数据的位置,如图所示:
==注==:逻辑结构是面向问题的,而物理结构是面向计算机的。
4.抽象数据类型
==数据类型==:是指一组性质相同的值的集合及定义再次集合上的一些操作的总称。
数据类型是按照值的不同进行划分的。在高级语言中,每个变量、常量和表达式都有各自的取值范围。类型就用来说明变量或表达式的取值范围和所能进行的操作。
为什么会考虑到数据类型?
因为在计算机中,内存是有限的,任意地开辟很大的内存空间会造成相应的浪费,于是计算机的研究者们就考虑,对数据进行分类,在C语言中,按照取值不同,数据类型可分为两类:
- 原子类型:是不可以再分解的基本类型,包括整型、实型、字符型等。
- 结构类型:由若干个类型组合而成,是可以再分解的。例如,整形数组是由若干整型数据组成的。
例如,int a,b 就意味着在给a,b赋值时不能超出int的取值范围,a,b之间的运算只能是int类型所允许的运算。
因为不同的计算机有不同的硬件系统,这就要求程序语言最终通过编译器或解释器转换成底层语言,如汇编语言甚至是通过机器语言的数据类型来实现的。可事实上,高级语言的编程者不管最终程序运行在什么计算机上,他的目的就是为了实现两个整型数字的运算,如a+b、a-b、axb和a/b等,他才不关心整数在计算机内部是如何表示的,也不想知道CPU为了实现1+2 进行几次开关操作,这些操作是如何实现的,对高级语言开发者来讲根本不重要。于是我们就会考虑,无论什么计算机、什么计算机语言,大都会面临着如整数运算、实数运算、字符运算等操作,我们可以考虑把它们都抽象出来。
==抽象数据类型(Abstract Data Type , ADT)==:是指一个数学模型及定义在该模型上的一组操作。
抽象数据类型是在已有的数据类型的基础上进行抽象而得到的。
抽象数据类型的定义仅取决于它的一组逻辑特性,而与其在计算机内部如何表示和实现无关。
比如刚才的例子,各个计算机,不管是大型机小型机、PC、 平板电脑、PDA,甚至智能手机都拥有“整数”类型,也需要整数间的运算,那么整型其实就是一个抽象数据类型,尽管它在上面提到的这些在不同计算机中实现方法上可能不样,但由于其定义的数学特性相同,在计算机编程者看来,它们都是相同的。因此,“ 抽象”的意义在于数据类型的数学抽象特性。
而且,抽象数据类型不仅仅指那些已经定义并实现的数据类型,还可以是计算机编程者在设计软件程序时自己定义的数据类型,比如我们编写关于计算机绘图或者地图类的软件系统,经常都会用到坐标。也就是说,总是有成对出现的x和y,在3D系统中还有z出现,既然这三个整型数字是始终在一起出现, 我们就定义-个叫point的抽象数据类型,它有X、y、z三个整型变量,这样我们很方便地操作一个 point数据变量就能知道这一点的坐标了。
根据抽象数据类型的定义,它还包括定义在该模型上的一组操作。就像“ 超级玛丽”这个经典的任天堂游戏,里面的游戏主角是马里奥(Mario)。我们给他定义了几种基本操作,走(前进、后退、上、下)、跳、打子弹等。一个抽象数据类型定义了:一个数据对象、数据对象中各数据元素之间的关系及对数据元素的操作。至于,一个抽象数据类型到底需要哪些操作,这就只能由设计者根据实际需要来定。像马里奥,可能开始只有两种操作,走和跳,后来发现应该要增加种打子弹的操作,再后来发现有些玩家希望它可以走得快一点, 就有了按住打子弹键后前进就会“跑”的操作。这都是根据实际情况来设计的。
抽象数据类型体现了程序设计中问题分解、抽象和信息隐藏的特性。抽象数据类型把实际生活中的问题分解为多个规模小且容易处理的问题,然后建立一个计算机能处理的数据模型,并把每个功能模块的实现细节作为一个独立的单元,从而使具体实现过程隐藏起来。
以下为==描述抽象数据类型的标准格式==:
来源:https://www.cnblogs.com/PursuingtheLight/p/11359716.html