首页 > 解决方案 > Vivado Synthesis 挂在 Jenkins 生成的 Docker 容器中

问题描述

我正在尝试将我们的大型 FPGA 构建移动到 Jenkins CI 环境中,但是当在 Jenkins 生成的 Docker 容器中运行时,构建会在综合结束时挂起。

我试图复制 Jenkins 正在创建的环境,但是当我自己生成一个 Docker 容器时,构建没有问题。

我试过了:

我还有一个非常小的构建,它可以毫无问题地通过 Jenkins 的整个构建过程,所以我认为我的 Docker 容器没有根本缺陷。

agent {
  docker {
    image "vivado:2017.4"
    args """
      -v <MOUNT XILINX LICENSE FILE>
      --dns <DNS_ADDRESS>
      --mac-address <MAC_ADDRESS>
    """
  }
}
steps {

  sh "chmod -R 777 ."

  dir(path: "${params.root_dir}") {
    timeout(time: 15, unit: 'MINUTES')  {
      // Create HLS IP for use in Vivado project
      sh './run_hls.sh'
    }
    timeout(time: 20, unit: 'MINUTES')  {
      // Create vivado project, add sources, constraints, HLS IP, generated IP
      sh 'source source_vivado.sh && vivado -mode batch -source tcl/setup_proj.tcl'
    }
    timeout(time: 20,   unit: 'MINUTES')    {
      // Create block designs from TCL scripts
      sh 'source source_vivado.sh && vivado -mode batch -source tcl/run_bd.tcl'
    }
    timeout(time: 1,  unit: 'HOURS')      {
      // Synthesize complete project
      sh 'source source_vivado.sh && vivado -mode batch -source tcl/run_synth.tcl'
    }
  }
}

下面的代码块正在运行 1 个作业,超时时间为 12 小时。您可以看到 Synthesis 已完成,然后在 8 小时后发生超时。

[2019-04-17T00:30:06.131Z] Finished Writing Synthesis Report : Time (s): cpu = 00:01:53 ; elapsed = 00:03:03 . Memory (MB): peak = 3288.852 ; gain = 1750.379 ; free physical = 332 ; free virtual = 28594
[2019-04-17T00:30:06.131Z] ---------------------------------------------------------------------------------
[2019-04-17T00:30:06.131Z] Synthesis finished with 0 errors, 0 critical warnings and 671 warnings.
[2019-04-17T08:38:37.742Z] Sending interrupt signal to process
[2019-04-17T08:38:43.013Z] Terminated
[2019-04-17T08:38:43.013Z] 
[2019-04-17T08:38:43.013Z] Session terminated, killing shell... ...killed.
[2019-04-17T08:38:43.013Z] script returned exit code 143

在本地生成的 Docker 容器中运行相同的命令没有任何问题。不幸的是,timeoutJenkins 步骤似乎没有刷新打开的缓冲区,因为我post:unsuccesful打印出所有日志文件的步骤没有找到synth_1,尽管我不希望与 Jenkins 捕获有任何不同。

Jenkins/Vivado 集成是否存在任何已知问题?有没有办法进入 Jenkins 生成的容器,这样我就可以尝试复制我所期待的和我正在经历的?

编辑:我已经在实际的 tcl 脚本中添加了一个超时,以超越 中wait_on_runs使用的命令run_synth.tcl,但现在我在实施过程中遇到了相同的挂起行为。

标签: dockerjenkinsxilinxvivado

解决方案


问题在于 vivado 处理(或不处理...)其分叉进程的方式。具体来说,我认为这适用于并行合成。这也许就是为什么您只在某些项目中看到它的原因。在您上面描述的状态下(在“合成完成”之后卡住)我注意到几个废弃的 vivado 僵尸进程。据我了解,这些是结束的子进程,但父母在结束自己之前没有收集状态。用straceeven 跟踪显示 vivado 试图杀死这些进程:

restart_syscall(<... resuming interrupted nanosleep ...>) = 0
kill(319, SIG_0)                     = 0
kill(370, SIG_0)                     = 0
kill(422, SIG_0)                     = 0
kill(474, SIG_0)                     = 0
nanosleep({tv_sec=5, tv_nsec=0}, 0x7f86edcf4dd0) = 0
kill(319, SIG_0)                     = 0
kill(370, SIG_0)                     = 0
kill(422, SIG_0)                     = 0
kill(474, SIG_0)                     = 0
nanosleep({tv_sec=5, tv_nsec=0}, <detached ...>

但是(众所周知)你不能杀死僵尸,他们已经死了......

通常这些进程将被 init 进程采用并在那里处理。但是对于 Docker 中的 Jenkins Pipeline,默认情况下没有 init。管道生成容器并在cat没有输入的情况下运行以使其保持活动状态。这样cat就变成了pid 1,带走了vivado的弃子。cat 当然不知道如何处理它们并忽略它们(真的是悲剧)。

cat,1
  |-(sh,16)
  |-sh,30 -c ...
  |   |-sh,31 -c ...
  |   |   `-sleep,5913 3
  |   `-sh,32 -xe /home/user/.jenkins/workspace...
  |       `-sh,35 -xe /home/user/.jenkins/workspace...
  |           `-vivado,36 /opt/Xilinx/Vivado/2019.2/bin/vivado -mode tcl ...
  |               `-loader,60 /opt/Xilinx/Vivado/2019.2/bin/loader -exec vivado -mode tcl ...
  |                   `-vivado,82 -mode tcl ...
  |                       |-{vivado},84
  |                       |-{vivado},85
  |                       |-{vivado},111
  |                       |-{vivado},118
  |                       `-{vivado},564
  |-(vivado,319)
  |-(vivado,370)
  |-(vivado,422)
  `-(vivado,474)

幸运的是,有一种方法可以在 docker 容器中拥有一个 init 进程。用传递--init论点docker run为我解决了问题。

agent {
    docker {
        image 'vivado:2019.2'
        args '--init'
    }
}

这创建了 vivado 似乎依赖的 init 进程,并且构建运行没有问题。

希望这对你有帮助!

干杯!


推荐阅读