c - CS50“恢复”问题 - 不完整的图像 - 两个不正确的字节
问题描述
第一次发帖,希望能帮到你!道歉的长度 - 只是想彻底。
我正在研究 CS50 问题集 4,我偶然发现了一个我还无法解决的有趣问题。我成功地恢复了 49 张图像,并且大约一半的图像似乎已正确恢复。但是,根据 Windows 资源管理器中的附加图像,其余图像在文件末尾具有不同程度的“损坏”数据。
鉴于这发生在文件中间,并且我似乎正确地找到了每个文件的开头,我相信这发生在我的 while 循环的后半部分 - 即“不是 jpg 标题”。我们被告知 jpg 文件是背靠背存储在原始数据上的,所以我认为我不需要考虑 jpg 文件末尾的任何异常情况。
为了解决这个问题,我进行了许多测试,但到目前为止没有成功:
- 通过与 card.raw 比较来验证总输出文件大小是否正确。
- 验证了我的 while 循环的后半部分运行图像 001.jpg 的预期次数 - 第一次出现问题。
- 在另一个 IDE 上运行
- 检查文件大小是否似乎与“损坏”文件有关,因为成功/不成功的输出没有明显的模式。
- 我认为可能是根本原因(缓冲区变量的定义、fread/fwrite 语句模式)的各种语法变化。
我最后的调试工作是将我的 001.jpg 版本与已完成此问题集的朋友提供的已知正确版本 001.jpg 进行比较。我在十六进制编辑器中比较了这些,发现两个字节(总共 105984)不正确。在 00002400 行和 00012400 行,我在 jpg 文件的十六进制视图中用“d8”代替了“00”。没有进一步的差异。
我在下面包含了我认为相关的代码区域以及 check50 结果。如果需要,我很乐意提供更多代码。我觉得我目前已经达到了我的理解极限,我不确定如何继续解决这个问题。谁能给我一些关于这里可能出现的问题的建议?
代码示例:
#include <stdint.h> //required for uint8_t
#include <stdio.h>
#include <stdlib.h>
const int SEG_SIZE = 512;
typedef uint8_t BYTE; //declaring byte to simplify code below
int main(int argc, char *argv[])
{
//check if single argument has been applied, give usage instructions if not.
//retracted
//open memory card file
// retracted code
//error handle
// retracted code
//define variables
BYTE buffer[SEG_SIZE]; //char=1 byte. 512 byte buffer for reading file.
char img_filename[8];
int count = -1; //declaring counter for number of files found. Starting at -1, allowing first found file to be number 0.
//declare jpg file. Declaring in loop produces errors, local variable is 'block scoped'.
FILE *img = NULL;
//repeat until end of card
while (fread(buffer, SEG_SIZE, 1, input)) //read 512 byte samples into buffer until end of file. returns number of items successfully read from file (i.e. 1)
{
//if start of new jpg
if ((buffer[0]==0xff) && (buffer[1]=0xd8) && (buffer[2] == 0xff) && ((buffer[3] & 0xf0) == 0xe0)) // retracted code //checking if first four bytes match the beginning of a new jpg.
{
count++;
if (count == 0) //found first image in raw data.
{
//retracted code - creates filename and opens file.
}
else
{
//closing previous file
// retracted code
img = fopen(img_filename, "w"); //opening next image file.
fwrite(buffer, SEG_SIZE, 1, img);
}
}
else if (count >= 0) //required to prevent running this code before declaring a file.
{
fwrite(buffer, SEG_SIZE, 1, img); //continue writing to current file, if present
}
}
// retracted code
}
check50 结果:
Results for cs50/problems/2021/x/recover generated by check50 v3.2.2
:) recover.c exists.
:) recover.c compiles.
:) handles lack of forensic image
:) recovers 000.jpg correctly
:( recovers middle images correctly
recovered image does not match
:) recovers 049.jpg correctly
提前致谢,
安迪。
解决方案
=
此行中缺少:
if ((buffer[0]==0xff) && (buffer[1]=0xd8) && (buffer[2] == 0xff) && ((buffer[3] & 0xf0) == 0xe0)) //checking if first four bytes match the beginning of a new jpg.
编译器不会给出“表达式不可赋值”错误,因为括号改变了表达式“是”的内容。buffer[1] = 0xd8
(没有括号)会给出错误。除了 之外(buffer[3] & 0xf0)
,内括号是无关的。
推荐阅读
- angular - Angular 6 - 如何从打字稿中提取翻译
- javascript - 如何在输入类型时间内设置自动对焦
- powershell - 用于从远程计算机中删除几个本地用户的 Powershell 脚本
- selenium - 如何为找到的 xpath 搜索父级(具有某些父级属性)?
- android - 这个布局是否嵌套了权重?
- java - glassfish 5 无法开始使用命令行
- jquery - 当日期为 0000-00-00 时设置 flatpickr 文本
- google-cloud-platform - 为 Google Cloud Storage 中存储桶中的所有对象设置元数据
- c# - WPF 用户控件绑定
- concourse - 如何在 concourse-docker 中使用本地 docker 镜像作为资源