首页 > 解决方案 > Golang 上传文件的 MIME 类型检查

问题描述

我正在尝试将 mime 类型的文件上传到我的服务器中。

.xlsx 和 .docx 文件 mime 类型出现在 application/zip 中。我试图解压缩文件并读取“_rels/.rels”类型的文件。我的疑问是在阅读这个特定文件时,我应该为阅读文件留下的最大大小是多少,如果目标是“xl/workbook.xml”,我可以假设它是 xlsx 类型吗?

我的代码如下

 file, fileHeader, err := r.FormFile("file")

buffer := make([]byte, 512)
_, err = file.Read(buffer)
if err != nil {
    fmt.Println(err)
}

contentType := http.DetectContentType(buffer)
if contentType == "application/zip" {
    r, err := zip.NewReader(file, fileHeader.Size)
    if err != nil {
        fmt.Println(err)
    }
    for _, zf := range r.File {
        if zf.Name == "_rels/.rels" {
            fmt.Println("rels")
            rc, err := zf.Open()
            if err != nil {
                fmt.Println("Rels errors")
            }
            const BufferSize = 1000
            buffer := make([]byte, BufferSize)
            defer rc.Close()
            bytesread, err := rc.Read(buffer)
            if err != nil {
                if err != io.EOF {
                    fmt.Println(err)
                }
            }

            fmt.Println("bytes read: ", bytesread)
            fmt.Println("bytestream to string: ", string(buffer[:bytesread]))
            fmt.Println(rc)
        }
    }
}


var arr []byte
w.Header().Set("Content-Type", "application/json")
w.Write(arr)

}

我得到的输出是

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<Relationships     xmlns="http://schemas.openxmlformats.org/package/2006/relationships"><Relationship Id="rId3" Type="http://schemas.openxmlformats.org/officeDocument/2006/relationships/extended-properties" Target="docProps/app.xml"/><Relationship Id="rId2" Type="http://schemas.openxmlformats.org/package/2006/relationships/metadata/core-properties" Target="docProps/core.xml"/><Relationship Id="rId1" Type="http://schemas.openxmlformats.org/officeDocument/2006/relationships/officeDocument" Target="xl/workbook.xml"/></Relationships>

关于如何阅读 .doc 或 .xls 的任何提示?

标签: gomime-types

解决方案


不幸的是DetectContentType,该html软件包仅限于它可以检测到的 mime 类型。

至于检测二进制格式,如果您只需要判断它是否是.doc,则不需要读取整个文件。您可以检查文件签名。文件签名的一个很好的资源是文件签名

如果你想使用现有的包,这是对 github 上的内容的总结。

免责声明:我是mimetype的作者。

  • 文件类型

    • 纯粹去,没有c绑定
    • 可以扩展以检测新的 mime 类型
    • 对于作为多个 mime 类型传递的文件存在问题(例如:xlsx 和 docx 作为 zip 传递),因为它将匹配函数存储在映射中,因此它不保证遍历的顺序
  • 魔术剧

    • 需要安装 libmagic-dev
    • 可以扩展,虽然更难...man magic
  • 模仿类型

    • 纯粹去,没有c绑定
    • 检测到的 mime 类型数量高于filetype
    • 是线程安全的
    • 可以扩展

推荐阅读