论坛里的诡异乱码问题
事先声明:我知道解决这个问题的难度很大,对拥有日活跃量千人级的网站而言很难解决,所以也不奢求站长来解决了。逛论坛的人经常会发现一部分东西变成了诡异的乱码(如图)。
这是什么原因呢?答:问题出在这里(看图)。
论坛使用古早时期的简体中文编码,也就是GBK编码(正式名称叫做“信息交换用汉字编码字符集·基本集”)。
GBK编码对于现今的大部分字符支持都是不完善的,例如在我的这个帖子里,它错误的把日文字符显示成了乱码(如图)。
static/image/hrline/line8.png
这个问题有解决方案,Discuz!的一名第三方开发者开发了字符集转换工具DiscuzGBK转UTF8编码 正式版(nayuan_gbk2utf8)_Discuz插件_Discuz应用中心 (dismall.com),可以将论坛无损转换为UTF8字符集(在MySQL里,应该叫转换为utf8mb4)。
但是,对于数据量大(视乎数据库大小而定)的网站,这个转换过程需要很长时间(意味着需要停机维护)。
因此我也不期望这个问题得到实质性的解决,只是在这里说明一下。
页:
[1]