java - 日语“半语音”字符的转换
问题描述
我试图比较两个包含日文字符的 spark 数据框,其中一些字符看起来相同但实际上与程序不同,例如 プ vs プ</p>
如果你把它们放在 utf-8 编码器中:
プ utf-8 = \xE3\x83\x97
プ utf-8 = \xE3\x83\x95\xE3\x82\x9A
好像フ(\xE3\x83\x95) + 小圆圈半声标(\xE3\x83\x95) = プ
这些区别叫什么,有什么方法可以在 Java/Scala 中转换它们?
谢谢你。
解决方案
推荐阅读
- javascript - 在全日历事件工具提示中不可见
- typescript - CircleCI 无法评估 TypeScript
- java - 使用 Facebook 登录的应用程序在开发中不起作用!它只是加载和关闭-Android Studio
- javascript - 通过 POST 请求发送文件流时出错
- r - 如何使用变量名中的多个正则表达式对数据框进行子集化?
- android - 如何修复没有这样的 NoSuchMethodError 颤振 tabView?
- python - 并行运行 luigi 任务
- excel - BOF 或 EOF 为 True ,或当前记录已被删除
- python - 为 geopandas 图生成图例
- php - 将 html mysql 表导入到 php 中。大数字在excel文件中转换为指数