数据库由大量数据组成。在RDBMS中,数据分组在一个表中,每个表都有相关的记录。用户可以看到数据以表格的形式存储,但实际上,大量数据以文件的形式存储在物理内存中。
文件- 文件名为相关信息的集合,记录在辅助存储器上,如磁盘、磁表和光盘。
什么是文件组织? 文件组织是指构成文件的各种记录之间的逻辑关系,尤其是在识别和访问任何特定记录的方式方面。简单来说,按一定顺序存储文件称为文件组织。 文件结构 指标签和数据块以及任何逻辑控制记录的格式。
文件组织的类型——
已经引入了各种方法来组织文件。这些特定的方法在访问或选择的基础上有优缺点。因此,程序员需要根据自己的需求来决定最适合的文件组织方法。 某些类型的文件组织包括:
- 顺序文件组织
- 堆文件组织
- 散列文件组织
- B+树文件组织
- 群集文件组织
我们将在本文的后续章节中讨论每个文件组织,以及每个文件组织方法的差异和优缺点。
顺序文件组织–
最简单的文件组织方法是顺序方法。在这种方法中,文件以顺序的方式一个接一个地存储。有两种方法可以实现此方法:
- 桩文件法- 这种方法非常简单,我们按顺序存储记录,即按插入表的顺序一个接一个地存储记录。
- 插入新记录—— 让R1、R3等直到R5和R4都是序列中的四条记录。在这里,记录只是任何表中的一行。假设必须在序列中插入一条新记录R2,那么它只是放在文件的末尾。
- 排序文件方法- 在这种方法中,正如名称本身所暗示的,每当需要插入新记录时,它总是以排序(升序或降序)的方式插入。记录的排序可以基于任何主键或任何其他键。
- 插入新记录—— 让我们假设,在R7和R8之前存在一个由四条记录R1、R3等组成的排序序列。假设必须在序列中插入一条新记录R2,那么它将被插入到文件末尾,然后它将对序列进行排序。
顺序文件组织的优点和缺点—— 优点——
- 快速有效地处理海量数据的方法。
- 设计简单。
- 文件可以很容易地存储在磁带中,即更便宜的存储机制。
缺点——
- 时间浪费,因为我们不能跳转到需要的特定记录上,但我们必须以顺序的方式移动,这需要我们的时间。
- 排序文件方法效率低下,因为它需要时间和空间来排序记录。
堆文件组织–
堆文件组织与数据块一起工作。在这种方法中,记录被插入到文件末尾的数据块中。这种方法不需要排序或排序。如果一个数据块已满,新记录将存储在另一个数据块中,在这里,另一个数据块不必是下一个数据块,但它可以是内存中的任何数据块。DBMS负责存储和管理新记录。
插入新记录—— 假设我们在堆R1、R5、R6、R4和R3中有四条记录,并且假设必须在堆中插入一条新记录R2,那么,由于最后一个数据块即数据块3已满,它将被插入DBMS选择的任何数据块中,比如数据块1。
如果我们想在堆文件组织中搜索、删除或更新数据,我们将从文件的开头遍历数据,直到获得请求的记录。因此,如果数据库非常庞大,搜索、删除或更新记录将花费大量时间。
堆文件组织的优点和缺点—— 优点——
- 获取和检索记录比顺序记录快,但仅限于小型数据库。
- 当一次需要将大量数据加载到数据库中时,这种文件组织方法最适合。
缺点——
- 未使用内存块的问题。
- 对于大型数据库来说效率低下。
阅读下一集: (DBMS文件组织集2)| DBMS中的哈希