首页 > 解决方案 > 通过将单个字符短缺的大小减小到 1 字节(7 位)来缩短 UTF8 编码的 db 大小

问题描述

我需要减小我的 sql DB 的大小。我的数据库字符串是 UTF8 编码,因为它是一种不同的语言。每个字符分配 2 个字节,因为该语言几乎包含 100 个字符来表示。我将如何将这些 16 位字符转换为 7 位字符以缩短我的数据库大小。

标签: javaandroidencodingutf-8

解决方案


我的数据库字符串是 UTF8 编码,因为它是一种不同的语言。每个字符分配 2 个字节

我将如何将这些 16 位字符转换为 7 位字符

不,这是一个矛盾。

UTF-8中,只需要 7 位(US-ASCII)的字符只需要 8 位(一个八位字节)。UTF-8 每个字符使用 1、2、3 或 4 个八位字节,具体取决于字符的代码点编号有多大。

相比之下, UTF-16每个字符使用一对或多对八位字节。

最好一般使用 UTF-8。一些人认为 UTF-16 是有害的。

推荐阅读:每个软件开发人员绝对、肯定必须了解 Unicode 和字符集的绝对最低要求(没有借口!)


推荐阅读