首页 > 解决方案 > 使用 libav (ffmpeg) 将 RGB 转换为 YUV 使图像一式三份

问题描述

我正在构建一个小程序来捕获视频上的屏幕(使用X11 MIT-SHM 扩展)。如果我为捕获的帧创建单独的 PNG 文件,效果很好,但现在我正在尝试集成 libav(ffmpeg)来创建视频,我得到了......有趣的结果。

我能达到的最远的地方就是这个。预期的结果(这是直接从 XImage 文件的 RGB 数据创建的 PNG)是这样的:

预期结果

但是,我得到的结果是这样的:

得到的结果

如您所见,颜色很时髦,图像被裁剪了三遍。我有一个捕获屏幕的循环,首先我生成单个 PNG 文件(当前在下面的代码中注释),然后我尝试使用 libswscale 从 RGB24 转换为 YUV420:

while (gRunning) {
        printf("Processing frame framecnt=%i \n", framecnt);

        if (!XShmGetImage(display, RootWindow(display, DefaultScreen(display)), img, 0, 0, AllPlanes)) {
            printf("\n Ooops.. Something is wrong.");
            break;
        }

        // PNG generation
        // snprintf(imageName, sizeof(imageName), "salida_%i.png", framecnt);
        // writePngForImage(img, width, height, imageName);

        unsigned long red_mask = img->red_mask;
        unsigned long green_mask = img->green_mask;
        unsigned long blue_mask = img->blue_mask;

        // Write image data
        for (int y = 0; y < height; y++) {
            for (int x = 0; x < width; x++) {
                unsigned long pixel = XGetPixel(img, x, y);

                unsigned char blue = pixel & blue_mask;
                unsigned char green = (pixel & green_mask) >> 8;
                unsigned char red = (pixel & red_mask) >> 16;

                pixel_rgb_data[y * width + x * 3] = red;
                pixel_rgb_data[y * width + x * 3 + 1] = green;
                pixel_rgb_data[y * width + x * 3 + 2] = blue;
            }
        }

        uint8_t* inData[1] = { pixel_rgb_data };
        int inLinesize[1] = { in_w };

        printf("Scaling frame... \n");
        int sliceHeight = sws_scale(sws_context, inData, inLinesize, 0, height, pFrame->data, pFrame->linesize);

        printf("Obtained slice height: %i \n", sliceHeight);
        pFrame->pts = framecnt * (pVideoStream->time_base.den) / ((pVideoStream->time_base.num) * 25);

        printf("Frame pts: %li \n", pFrame->pts);
        int got_picture = 0;

        printf("Encoding frame... \n");
        int ret = avcodec_encode_video2(pCodecCtx, &pkt, pFrame, &got_picture);

//                int ret = avcodec_send_frame(pCodecCtx, pFrame);

        if (ret != 0) {
            printf("Failed to encode! Error: %i\n", ret);
            return -1;
        }

        printf("Succeed to encode frame: %5d - size: %5d\n", framecnt, pkt.size);

        framecnt++;

        pkt.stream_index = pVideoStream->index;
        ret = av_write_frame(pFormatCtx, &pkt);

        if (ret != 0) {
            printf("Error writing frame! Error: %framecnt \n", ret);
            return -1;
        }

        av_packet_unref(&pkt);
    }

我已将整个代码放在这个 gist上。此处的这个问题看起来与我的非常相似,但并不完全相似,并且该解决方案对我不起作用,尽管我认为这与计算线步长的方式有关。

标签: cvideoffmpegyuvlibav

解决方案


不要使用av_image_alloc使用av_frame_get_buffer

(与您的问题无关,但使用avcodec_encode_video2现在被认为是不好的做法,应该替换为avcodec_send_frameand avcodec_receive_packet


推荐阅读