Dawn's Blogs

分享技术 记录成长

0%

Docker学习笔记 (1) 基本概念

Docker介绍

什么是Docker

Docker是基于Go语言开发并实现的,基于Linux内核的cgroups(control groups,控制群组,是Linux内核的一个功能,用来限制、控制与分离一个进程组的资源,如CPU、内存等)、namespace(是Linux内核用来隔离内核资源的方式,通过namespace可以让一些进程只能看到与自己相关的一部分资源,而另外一些进程也只能看到与它们自己相关的资源)以及Union FS等技术,对进程进行封装隔离,属于操作系统层面的虚拟化技术

Docker和传统虚拟化技术的不同:

传统虚拟机技术是虚拟出一套硬件后,在其上运行一个完整操作系统,在该系统上再运行所需应用进程:

传统虚拟化

Docker容器内的应用进程直接运行于宿主的内核,容器内没有自己的内核,而且也没有进行硬件虚拟。因此容器要比传统虚拟机更为轻便:

Docker

为什么使用Docker

Docker与传统虚拟化技术相比,有如下优点

  • 更高效的利用系统资源:Docker不需要对硬件虚拟化以及运行完整的操作系统等额外开销,所以Docker对系统资源的利用更有效。在相同配置下,Docker可以运行更多的应用程序。
  • 更快速的启动时间:Docker容器运行于宿主内核,启动速度可以达到秒级。
  • 一致的运行环境:Docker镜像提供了除内核外完整的运行时环境,确保了应用运行环境一致性。
  • 持续交付和部署:一次创建或配置,可以在任意地方正常运行。
  • 更轻松的迁移:Docker确保了执行环境的一致性,使得应用的迁移更加容易。
  • 更轻松的维护和扩展:Docker使用的分层存储以及镜像的技术,使得应用重复部分的复用更为容易,也使得应用的维护更新更加简单,基于基础镜像进一步扩展镜像也变得非常简单。
特性 Docker容器 传统虚拟机
启动 秒级 分钟级
硬盘使用 一般为 MB 一般为 GB
性能 接近原生 弱于
系统支持量 单机支持上千个容器 一般几十个

基本概念

Docker包括三个基本概念:

  • 镜像(Image)
  • 容器(Container)
  • 仓库(Repository)

镜像

对于 Linux 而言,内核启动后,会挂载 root 文件系统为其提供用户空间支持。而 Docker 镜像(Image),就相当于是一个 root 文件系统。

Docker 镜像是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数(如匿名卷、环境变量、用户等)。镜像不包含任何动态数据,其内容在构建之后也不会被改变。

分层存储

Docker设计时,就充分利用了Union FS(联合文件系统)技术,将其设计为分层存储的结构。

镜像只是一个虚拟的概念,其实际体现并非由一个文件组成,而是由一组(多层)文件系统组成。

镜像构建时,会一层层构建,前一层是后一层的基础。每一层构建完就不会再发生改变,后一层上的任何改变只发生在自己这一层。比如,删除前一层文件的操作,实际不是真的删除前一层的文件,而是仅在当前层标记为该文件已删除。在最终容器运行的时候,虽然不会看到这个文件,但是实际上该文件会一直跟随镜像。因此,在构建镜像的时候,需要额外小心,每一层尽量只包含该层需要添加的东西,任何额外的东西应该在该层构建结束前清理掉。

分层存储使得镜像的复用、定制更加容易,可以用之前构建好的镜像作为基础层,然后进一步添加新的层,以定制自己所需的内容,构建新的镜像。

docker镜像加载原理

docker的镜像实际上由一层一层的文件系统组成。

  • bootfs(boot file system)主要包含bootloader和kernel。bootloader主要是引导加载kernel,Linux刚启动时会加载bootfs文件系统,在Docker镜像的最底层是引导文件系统bootfs。这一层与典型的Linux/Unix系统是一样的,包含boot加载器和内核。当boot加载完成之后整个内核就都在内存中了,此时内存的使用权已由bootfs转交给内核,此时系统也会卸载bootfs。

  • rootfs(root file system),在bootfs之上。包含的就是典型 Linux 系统中的/dev、/proc、/bin、/etc等标准目录和文件。rootfs就是各种不同的操作系统发行版,如Ubuntu、CentOS等。

image-20221223111944166

对于一个精简的OS,rootfs可以很小,只需要包括最基本的命令、工具和程序库就可以了,因为底层直接用Host的kernel,自己只需要提供 rootfs 就行了。由此可见对于不同的linux发行版, bootfs基本是一致的, rootfs会有差别, 因此不同的发行版可以公用bootfs。

容器

镜像和容器的关系,就像是类和实例的关系。镜像是静态的定义,容器是镜像运行时的实体。容器可以被创建、启动、停止、删除、暂停等。

容器的实质是进程,但与直接在宿主执行的进程不同,容器进程运行于属于自己的独立的命名空间。因此容器可以拥有自己的 root 文件系统、自己的网络配置、自己的进程空间,甚至自己的用户 ID 空间。容器内的经常运行在一个隔离的环境里,因此也更加的安全。

容器存储层

容器也使用分层存储,每一个容器运行时,以镜像为基础层,在其上创建一个当前容器的存储层用于容器运行时的读写,称为容器存储层。只有容器层是可写的,容器层下面的所有镜像层都是只读的

image-20221223112458661

容器存储层的生存周期和容器一样,容器消亡时,容器存储层也随之消亡。因此,任何保存于容器存储层的信息都会随容器删除而丢失。因此所有的文件写入操作,都应该使用数据卷(Volume),数据卷的生存周期独立于容器,容器消亡,数据卷不会消亡。因此,使用数据卷后,容器删除或者重新运行之后,数据却不会丢失。

仓库

Docker Registry用于提供集中的存储、分发镜像的服务。

一个Docker Registry中可以包含多个仓库(Repository),每个仓库包含多个标签(Tag,标签用于指明镜像的版本),每个标签对应一个镜像

可以通过<仓库名>:<标签>指定哪个版本的镜像,默认标签为latest