查看: 262|回复: 7

ド字符搜索有问题

[复制链接]
发表于 2020-1-23 23:32 | 显示全部楼层 |阅读模式
透透说:“问我作甚!去管理版发帖!”
所以我只能灰溜溜过来了...
希望能被大神看到(
希望能被大神解决(
8L}9D8(WZ~YK1GF~625A8U4.png


起因是这个帖子 https://bbs.yamibo.com/thread-502135-1-1.html ,想看看作者还画过啥,于是复制粘贴作者名字ヨドカワ 搜索,出来的结果不太妙,如下图(PS:手机版搜索出来无结果)。
1.png

想了想,把作者的名字复制去别的地方搜索,然后将搜索出来的ヨドカワ再复制回来,一搜索,结果如下图。
2.png

然后确定下来是ド字符有问题,从https://bbs.yamibo.com/thread-502135-1-1.html 这个帖子复制出来的ド字符,搜索出来结果如图。
3.png

而从https://bbs.yamibo.com/thread-499924-1-1.html 这个帖子复制出来的,搜索出来如下图。
4.png

两者结果相差甚远并且不重合。

所以这是怎么肥事 IX$R[PHDAGS}~KOSL3{FHV9.jpg


对了,大家能看出
ドドドドドドドドドド

ドドドドドドドドドド
的区别吗?
(我可以诶)
回复

使用道具 举报

发表于 2020-1-24 03:57 | 显示全部楼层
(连着问题和回复都看不懂耶)(也看不出区别耶)
回复

使用道具 举报

发表于 2020-1-24 10:16 | 显示全部楼层
我还做了叠图,哪里有区别嘛

错开一个像素50%透明度

QQ截图20200124101416.png
对齐 50%透明度

QQ截图20200124101436.png

评分

参与人数 3积分 +12 收起 理由
龙心乏尘 + 1 过于强大
hongyuny + 5 你太可爱
742553627 + 6

查看全部评分

回复

使用道具 举报

发表于 2020-1-24 12:24 | 显示全部楼层
未命名.png
打開網頁原始碼長這樣(<br />是換行,別在意)

你會發現他其實是兩個東西拼在一起的


這個&#12441呢,轉成hex就是Unicode的u3099
對應的字符就是日文濁音那兩個點點
用途跟西方字母頭上一些奇怪的東西是一樣的(不信的話把這個符號加到漢字前面就知道了ww)
所以系統就幫忙拼了起來,對於大部分字體來看是一模一樣的


解決辦法的話,自己打囉
除非後端寫個腳本全取代掉(風險很高呢hmm)


评分

参与人数 2积分 +22 收起 理由
hongyuny + 20 呜呜呜
Wrife + 2 精品文章

查看全部评分

回复

使用道具 举报

发表于 2020-1-26 01:36 | 显示全部楼层
其實郷本老師的 郷 也是
這跟鄉村的 鄉 略有不同

点评

@a0193143 嗯嗯,我指的是搜索會有問題的事  发表于 2020-1-26 23:38
這其實是兩個不同的字了,是不一樣的概念  发表于 2020-1-26 23:13

评分

参与人数 1积分 +10 收起 理由
hongyuny + 10 真的诶...

查看全部评分

回复

使用道具 举报

发表于 2020-1-28 23:28 | 显示全部楼层
你可以百度下组合字符, 我也上次看到出这个问题了才知道原来浊音和半浊音可以用组合字符的方式输入的
论坛用的是gbk编码, 浊音半浊音在gbk编码里都是独立的字符, 而这种组合字符gbk编码是不支持的, 然后浏览器比较智能地转成了字符实体, 就是你看到的&#一串数字, 而dz默认是不允许输入字符实体的, 于是字符实体就被转义最后被原样输出
之前你遇到的那个漫画标题发帖后会变出个12441的也是这个问题, 所以后来依照旧版论坛的修改方法, 允许了部分字符实体, 现在应该发帖不会出现那种情况了, 不过搜索结果的显示好像还是会有点问题
这个问题应该很久之前就有了, 因为论坛一直用的是gbk编码, 就算是utf8编码, 搜索这块按道理说这两种字符搜索也不能互通
解决方案的话, 暂时就避开这种浊音半浊音假名, 搜其他关键词吧, 或许哪天有空在发帖前做个转换, 不过正如6楼说的那样, 旧数据还是得转换一遍

评分

参与人数 1积分 +20 收起 理由
hongyuny + 20 感谢大大!

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 成为会员

本版积分规则

小黑屋|手机版|Archiver|百合会 ( 苏公网安备 32030302000123号 )

JS of wanmeiff.com and vcpic.com Please keep this copyright information, respect of, thank you!JS of wanmeiff.com and vcpic.com Please keep this copyright information, respect of, thank you!

GMT+8, 2020-3-30 06:09

Powered by Discuz! X3.4 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表