go - 为什么 calibre 不会读取重新创建的 .epub 文件上的元数据?
问题描述
我正在编写一个程序,它需要一个 .epub 文件,解压缩它,编辑content.opt
文件以添加自定义元数据,然后压缩内容以创建一个新的 .epub 文件。我将 calibre 用作我的电子阅读器和 .epub 编辑器,因为 calibre 可以很容易地编辑 .epub 的元数据以及 .epub 文件的内容。
我能够成功创建一个新的 .epub 文件。我已经测试过这个新文件可以用 calibre 和我的 Kobo 电子阅读器阅读。
但是,原始 .epub 文件中的任何元数据都不会传输到新的 .epub 文件。此外,我无法在 calibre 中编辑 .epub 文件。当我尝试时,我收到错误“epub 中没有 META-INF/container.xml”。我尝试使用多个 .epub 文件,但得到了相同的结果和错误。
解压后,.epub原文件内容如下:
META/INF
↳container.xml
content.opf
mimetype
pages_styles.css
[title]_split_000.xhtml
[title]_split_001.xhtml
.....
[title]_split_012.xhtml
[title]_split_013.xhtml
stylesheet.css
toc.ncx
新创建的 .epub 文件的解压缩目录与原始目录相同。运行diff -r -q /[title]_original /[title]_recreated
不会产生任何输出,这表明它们实际上是相同的。所以我不确定calibre如何读取一个文件而不读取另一个文件。该错误似乎表明 calibre 无法找到 META-INF/container.xml 文件,该文件用于告诉电子阅读器元数据存储在目录中的位置。
注意:在解压缩或压缩过程中,我不会编辑原始 .epub 的任何内容,直到我能够弄清楚发生了什么。
我正在go run main.go zip.go
使用两个 go 文件和 .epub 文件 [title] 的目录中运行命令:
main.go
package main
import (
// "log"
// "strings"
)
type FileLocations struct {
src string
ext string
dest string
}
func main() {
fileName := "[title]"
temp := FileLocations{
src: fileName,
ext: ".epub",
dest: fileName,
}
// Unzip the zip/epub file
UnzipHelper(temp.src, temp.ext, temp.dest)
// Zip the modified directory
ZipHelper(temp.src, temp.ext)
}
func UnzipHelper(src string, ext string, dest string) error {
_, err := Unzip(src, ext, dest)
if err != nil {
return err
}
return nil
}
func ZipHelper(src string, ext string) error {
err := Zip(src, ext)
if err != nil {
return err
}
return nil
}
zip.go
package main
import (
"archive/zip"
"fmt"
"io"
"log"
"os"
"path/filepath"
"strings"
)
func Unzip(src string, ext string, dest string) ([]string, error) {
file := src + ext
var filenames []string
r, err := zip.OpenReader(file)
if err != nil {
return filenames, err
}
defer r.Close()
for _, f := range r.File {
// Store filename/path for returning and using later on
fpath := filepath.Join(dest, f.Name)
// Check for ZipSlip
if !strings.HasPrefix(fpath, filepath.Clean(dest)+string(os.PathSeparator)) {
return filenames, fmt.Errorf("%s: illegal file path", fpath)
}
filenames = append(filenames, fpath)
if f.FileInfo().IsDir() {
// Make Folder
os.MkdirAll(fpath, os.ModePerm)
continue
}
// Make File
if err = os.MkdirAll(filepath.Dir(fpath), os.ModePerm); err != nil {
return filenames, err
}
outFile, err := os.OpenFile(fpath, os.O_WRONLY|os.O_CREATE|os.O_TRUNC, f.Mode())
if err != nil {
return filenames, err
}
rc, err := f.Open()
if err != nil {
return filenames, err
}
_, err = io.Copy(outFile, rc)
// Close the file without defer to close before next iteration of loop
outFile.Close()
rc.Close()
if err != nil {
return filenames, err
}
}
// Remove zip file so it can be recreated later
os.Remove(file)
return filenames, nil
}
func Zip(filename string, ext string) error {
// Creates .epub file
file, err := os.Create(filename + ext)
if err != nil {
log.Fatal("os.Create(filename) error: ", err)
}
defer file.Close()
w := zip.NewWriter(file)
defer w.Close()
walker := func(path string, info os.FileInfo, err error) error {
fmt.Println("Crawling: " + path)
if err != nil {
return err
}
if info.IsDir() {
return nil
}
file, err := os.Open(path)
if err != nil {
return err
}
defer file.Close()
f, err := w.Create(path)
if err != nil {
return err
}
_, err = io.Copy(f, file)
if err != nil {
return err
}
return nil
}
err = filepath.Walk(filename, walker)
if err != nil {
log.Fatal("filepath.Walk error: ", err)
}
return err
}
解决方案
我迟到了一个月,但我遇到了同样的问题,并意识到我正在压缩包含 epub 内容的文件夹,而不是文件夹内的内容。
压缩文件夹时,生成的 .zip 文件将遵循相同的目录结构,因此您将拥有一个包含实际电子书内容的子文件夹。您收到此错误的原因是 META-INF 在此子文件夹中,而不是在根目录中。
示例:如果您将 epub 的内容放在名为 temp_files 的文件夹中,则当您压缩此文件夹时,文件结构将如下所示:
+ your_zipped_file.zip
+ temp_files
- META-INF
- OEBPS
- mimetype
什么时候应该:
+ your_zipped_file.zip
-META-INF
-OEBPS
-mimetype
(英语不是我的第一语言,所以请原谅任何错误)
推荐阅读
- angular - 如何为固定数值属性创建打字稿界面
- pytorch - 我想确认哪些计算 Dice Loss 的方法是正确的
- aspen - 如何使用热流作为蒸馏塔的节能措施
- python - windows打开时如何制作自动运行的python文件
- css - 如何在没有媒体查询的情况下限制超宽屏幕中的内容宽度
- powerbi - 如何使 Power BI 只刷新源查询而不是所有子查询?
- javascript - 使用 formio 渲染 iframe
- spring - SpringBoot:在 application.yaml 中动态设置属性
- sql - 在 PostgreSQL / pgAdmin4 中从串行切换到身份数据类型后出现重复列
- flash - WideVineCDM 不工作或 Ruffle Flash 模拟器