海量编程文章、技术教程与实战案例

网站首页 > 技术文章 正文

MySQL技术内幕3:MySQL逻辑存储层级和物理存储结构

yimeika 2025-06-24 19:26:04 技术文章 4 ℃

0.简介

MySQL 的逻辑存储层级和物理存储结构是其高效数据管理的核心设计。逻辑存储层级从用户角度组织数据,包括数据库、表、行、列等;物理存储结构则从系统角度管理数据在磁盘上的存储方式,包括表空间、段、区、页等。本文将从逻辑存储以及物理存储两个方面来读MySQL来进行解读。

1.逻辑层次

逻辑存储层级是从用户角度看到的数据库组织结构,描述了数据在逻辑上的层次关系。MySQL 的逻辑存储层级主要包括以下几个部分:

1) 数据库(Database)

  • 定义:数据库是 MySQL 中的顶级逻辑容器,用于组织和管理相关的数据。
  • 作用:一个 MySQL 实例可以包含多个数据库,每个数据库相互独立。
  • 操作示例:
CREATE DATABASE mydb;USE mydb;

2) 表(Table)

  • 定义:表是数据库中的基本存储单元,用于存储具有相同结构的数据。
  • 组成:表由行(Row)和列(Column)组成。
  • 操作示例:
CREATE TABLE mytable (    id INT PRIMARY KEY,    name VARCHAR(50));

3)行(Row)

  • 定义:行是表中的一条记录,表示一个实体的数据。
  • 特点:每行数据包含多个列的值。
  • 操作示例:
INSERT INTO mytable (id, name) VALUES (1, 'Alice');

4) 列(Column)

  • 定义:列是表的字段,对于数据的类型以及数据的限制进行定义。
  • 特点:每列都可以定义自己的类型和限制(not null等)。
  • 操作示例:
ALTER TABLE mytable ADD COLUMN age INT;

5)索引(Index)

  • 定义:索引的定义一般来说是为了加速数据查找,其一般使用特殊的存储结构。
  • 类型:索引类型有很多,常见的有唯一索引,主键索引等。
  • 操作示例:
CREATE INDEX idx_name ON mytable (name);

6)视图(View)

  • 定义:视图是基于 SQL 查询结果的虚拟表。
  • 特点:视图不存储数据,而是动态生成。
  • 操作示例:
CREATE VIEW myview AS SELECT id, name FROM mytable;

7) 存储过程和函数(Stored Procedure & Function)

  • 定义:这个是预编译的 SQL 代码块,常常用于复杂逻辑。
  • 操作示例:
CREATE PROCEDURE myproc() BEGIN ... END;

8)触发器(Trigger)

  • 定义:触发器为了是在指定的事件发生时触发指定sql。
  • 操作示例:
CREATE TRIGGER mytrigger BEFORE INSERT ON mytable FOR EACH ROW BEGIN ... END;

2.存储目录

对于数据存放的路径获取可以查看配置文件或者使用如下语句查看:

mysql> show variables like '%datadir%';
+---------------+-----------------------------------------------+
| Variable_name | Value                                         |
+---------------+-----------------------------------------------+
| datadir       | /home/xxxx/openSource/DataBase/mysql/data/ |
+---------------+-----------------------------------------------+
1 row in set (0.02 sec)

查看系统库,自带的有四个库,可以和后面目录来进行对应:

1)information_schema:保存其他数据库的信息,像有哪些表,视图等。

2)mysql:存储账户、权限、存储过程、日志信息等。

3)performance_schema:存储运行状态信息,像内存使用,最近执行语句等。

4)sys:通过视图的方式把information_schema和performance_schema结合起来,方便查看性能信息。

接下来来看一个库目录的结构(以test库举例,内有两个表,t1和t2),其对应的test目录下会存在两个文件:t1.ibd,t2.ibd,也就是两个表的独立存储空间。

3.数据布局

上面我们知道每个表数据都对应存储在一个表空间中,其中是由段,区和页组成。

1)表空间:用于存放一个表的全部数据。

2)段:段是表空间中的一块空间,是表空间的组成单位,索引一般的话在表空间中会组织成两个段,也就是叶子节点段(数据段)和非叶子节点段(索引段),这样通过两个段来存储更好的保证了叶子节点连续性,提升磁盘读取效率。

3)区:由多个页组成,根据页大小,区大小也有不同规格,如对于不大于16k的页来说,区一般是1M。

4)页:一段连续的确定大小的空间。

3.1 表空间

表空间可以分为三类:系统表空间,独立表空间,其他表空间。

1)系统表空间:其除了记录基本数据之外还需要记录许多整个系统的属性

2)独立表空间:独立表空间结构如下图所示:

3)其他表空间:其他表空间由undo表空间,temp 表空间,general表空间。

3.2 段

段是管理的第二个各层级,常常由多个区共同构成,其是一个逻辑上管理的概念,可以看上面途中INODE_Entry,其包含段id,使用页面以及对应的管理链表。

3.3 区

区由多个页组成,可以参考系统表空间的图,就是由多个页面区构成。

3.4 页

其页面结构如下,不同页面间通过双向链表连接:

Tags:

最近发表
标签列表