首页 > 解决方案 > Windows ODBC 驱动程序 - 检索到的表情符号数据呈现为?

问题描述

重复线程注释

我已经针对这个问题提出了一个类似的问题(通过 ODBC 连接检索的表情符号数据显示为问号)但更多的是查看经典 ASP 页面的设置,但我现在提出一个问题来寻求 ODBC 驱动程序的帮助因为我认为我遇到的问题与此有关。

环境细节

我从经典 ASP 页面连接到 MySQL 版本 5.5.50-log(问题也在 5.7.28-log 和 MySQL 8 上复制)。所有运行 32 位 MySQL 服务器,使用 32 位 ODBC 驱动程序。

我在 Windows 10 PC 上运行代码,但实时站点在 Windows 2012 Server 上运行。两个系统都存在这个问题。

问题

问题是,当我使用 ODBC 驱动程序连接到 MySQL 并显示输出时,?即使我可以看到表情符号已正确保存在数据库中,表情符号数据也会显示为 a 而不是表情符号。只是当它通过ODBC提取并显示在页面上时,它显示为一个?字符。

MySQL 详细信息

MySQL数据库设置如下:

数据库字符集:utf8mb4 数据库排序规则:utf8mb4_general_ci 表和字段:

字符集:utf8mb4 排序规则:utf8mb4_general_ci

从我所看到的情况来看,MySQL 数据库在排序规则等方面设置正确:

Variable_name             Value               
------------------------  --------------------
character_set_client      utf8mb4             
character_set_connection  utf8mb4             
character_set_database    utf8mb4             
character_set_filesystem  binary              
character_set_results     utf8mb4             
character_set_server      latin1              
character_set_system      utf8                
collation_connection      utf8mb4_general_ci  
collation_database        utf8mb4_general_ci  
collation_server          latin1_swedish_ci   

为了测试,我在表中有数据,其中包含以下字符串:(T_T) é, è, à, ç

这是来自 SQLyog 的数据的屏幕截图:

在此处输入图像描述

测试网页

这是我的测试网页:

<!DOCTYPE html>

<html lang="en">
    <head>
        <meta charset="utf-8">
        <meta http-equiv="X-UA-Compatible" content="IE=edge">
        <meta name="viewport" content="width=device-width, initial-scale=1.0">
        <title>Test</title>
        <link rel="stylesheet" href="https://maxcdn.bootstrapcdn.com/bootstrap/3.3.6/css/bootstrap.min.css">
    </head>
    <body>
    <p>Pasted directly from database field: (T_T) é, è, à, ç</p>
    <p>Returned from SQL statement: ?(T_T) é, è, à, ç</p>
    </body>
</html>

关于该问题的更多说明

问题不在于 emoji 数据无法显示在网页上,因为直接从 MySQL 粘贴的内容看起来很好。

问题是,一旦通过 ODBC 驱动程序从 MySQL 的 SQL 选择返回数据,它就不能正确呈现。

关于经典 ASP 页面设置的注意事项

我在 ASP 代码的顶部设置了以下内容:

<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>
<%
Response.ContentType = "text/html"
Response.AddHeader "Content-Type", "text/html;charset=UTF-8"
Response.CodePage = 65001
Response.CharSet = "UTF-8"

ASP 页面本身保存为 UTF-8 编码文件:

在此处输入图像描述

我知道表情符号数据在页面上显示良好,因为来自 MySQL 的粘贴内容正确呈现。

ODBC 驱动程序说明

我认为问题与 ODBC 连接器有关,但我已经尝试了我能想到的一切,但没有任何效果。

我试过这些驱动程序:

我尝试过使用连接字符串和 DSN 连接,问题都发生在它们身上。

示例连接字符串:

oConn.Open "DRIVER={MySQL ODBC 5.3 Unicode Driver}; port=33066; option=16387; server=localhost; database=db1083; user=cheese; password=string; option=3; charset=utf8mb4; stmt=set names 'utf8mb4';"

我尝试使用 DSN 连接并设置启用正确字符集的连接属性,并在支持使用它的旧版本 ODBC 驱动程序上设置初始语句。

我现在没主意了!

这可能是 ODBC 驱动程序的错误吗?

标签: mysqlasp-classicodbcadodb

解决方案


据我所知,使用 ADODB 和 MySQL 连接器/ODBC 检索 Unicode 补充字符(例如,表情符号)的唯一方法是将它们作为字节检索SELECT CAST(column_name AS BINARY)——然后对它们进行解码。下面的示例实际上是 VBA,但为 VBScript 调整它是微不足道的。

Option Explicit

Sub demo_retrieve_utf8mb4_value()
    Dim conn As New ADODB.Connection
    conn.Open _
        "DRIVER=MySQL ODBC 8.0 Unicode Driver;" & _
        "SERVER=localhost;PORT=3307;" & _
        "UID=root;PWD=(whatever);" & _
        "DATABASE=mydb;" & _
        "charset=utf8mb4;"
    Dim rst As New ADODB.Recordset
    rst.Open "SELECT CAST(emoji AS BINARY) FROM emoji_tbl WHERE id=1", conn
    Dim s As Variant
    s = decode_utf8(rst.Fields(0).Value)
    '
    ' do stuff with the string value

End Sub

Private Function decode_utf8(field_value As Variant) As Variant
    If IsNull(field_value) Then
        decode_utf8 = Null
    Else
        Dim strm As New ADODB.Stream
        With strm
            .Type = adTypeBinary
            .Open
            .Write field_value
            .Flush
            .Position = 0
            .Type = adTypeText
            .Charset = "UTF-8"
            decode_utf8 = .ReadText
            .Close
        End With
        Set strm = Nothing
    End If
End Function

推荐阅读