docker checkpoint

描述管理检查点
用法docker checkpoint

实验性功能

此命令为实验性功能。

实验性功能旨在用于测试和反馈,其功能或设计可能会在版本之间发生变化而无需警告,或者可能在将来的版本中完全删除。

描述

检查点和恢复是一个实验性功能,允许您通过指定检查点来冻结正在运行的容器,这会将容器状态转换为磁盘上的文件集合。稍后,可以从冻结点恢复容器。

这是使用名为 CRIU 工具实现的,它是此功能的外部依赖项。这篇 Kubernetes 博客文章 对 Docker 中检查点和恢复历史进行了很好的概述。

安装 CRIU

如果您使用的是 Debian 系统,您可以添加 CRIU PPA 并使用 apt-get 从 CRIU Launchpad 安装。

或者,您可以 从源代码构建 CRIU

您至少需要 CRIU 2.0 版本才能在 Docker 中运行检查点和恢复。

检查点和恢复的用例

此功能目前专注于检查点和恢复的单主机用例。以下是一些例子:

  • 在不停止/启动容器的情况下重新启动主机。
  • 加快慢启动应用程序的启动时间。
  • 将进程“倒回”到较早的时间点。
  • 对正在运行的进程进行“取证调试”。

检查点和恢复在 Docker 之外的另一个主要用例是从一台机器到另一台机器的服务器实时迁移。这在当前的实现中是可能的,但目前并非优先事项(因此工作流程并未针对此任务进行优化)。

使用检查点和恢复

引入了一个新的顶级命令 docker checkpoint,它具有三个子命令:

  • docker checkpoint create(创建新的检查点)
  • docker checkpoint ls(列出现有检查点)
  • docker checkpoint rm(删除现有检查点)

此外,docker container start 命令中添加了 --checkpoint 标志。

docker checkpoint create 的选项

Usage:  docker checkpoint create [OPTIONS] CONTAINER CHECKPOINT

Create a checkpoint from a running container

  --leave-running=false    Leave the container running after checkpoint
  --checkpoint-dir         Use a custom checkpoint storage directory

以及如何恢复容器

Usage:  docker start --checkpoint CHECKPOINT_ID [OTHER OPTIONS] CONTAINER

在容器上使用检查点和恢复的示例

$ docker run --security-opt=seccomp:unconfined --name cr -d busybox /bin/sh -c 'i=0; while true; do echo $i; i=$(expr $i + 1); sleep 1; done'
abc0123

$ docker checkpoint create cr checkpoint1

# <later>
$ docker start --checkpoint checkpoint1 cr
abc0123

此过程只是将递增计数器记录到标准输出。如果您在运行/检查点/恢复之间运行 docker logs,您应该看到计数器在进程运行时增加,在进程冻结时停止,并在您恢复后从中断处继续。

已知限制

seccomp 仅在最新的内核中受 CRIU 支持。

不支持外部终端(即 docker run -t ..)。如果您尝试为具有外部终端的容器创建检查点,则会失败。

$ docker checkpoint create cr checkpoint1
Error response from daemon: Cannot checkpoint container c1: rpc error: code = 2 desc = exit status 1: "criu failed: type NOTIFY errno 0\nlog file: /var/lib/docker/containers/eb62ebdbf237ce1a8736d2ae3c7d88601fc0a50235b0ba767b559a1f3c5a600b/checkpoints/checkpoint1/criu.work/dump.log\n"

$ cat /var/lib/docker/containers/eb62ebdbf237ce1a8736d2ae3c7d88601fc0a50235b0ba767b559a1f3c5a600b/checkpoints/checkpoint1/criu.work/dump.log
Error (mount.c:740): mnt: 126:./dev/console doesn't have a proper root mount

子命令

命令描述
docker checkpoint create从正在运行的容器创建检查点
docker checkpoint ls列出容器的检查点
docker checkpoint rm删除检查点