V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
cctvsmg
V2EX  ›  问与答

怎么处理一段gbk、utf-8混合编码的字符串

  •  
  •   cctvsmg · 2013-11-18 22:52:40 +08:00 · 4098 次点击
    这是一个创建于 4060 天前的主题,其中的信息可能已经有所发展或是发生改变。
    情况是这样的:
    读一个网页返回内容是json
    里面大部分是gbk少部分是乱码
    这个乱码部分是utf-8编码

    如果按照gbk ignore解码
    最后会出现有的 json的 ' 被吃掉
    例如:

    'php': '浗锛屽彜鏃', -------> 'php':'xxxxxx,

    右边的 ' 于是就消失了
    于是json就无法加载
    3 条回复    1970-01-01 08:00:00 +08:00
    plprapper
        1
    plprapper  
       2013-11-19 00:21:27 +08:00   ❤️ 1
    搞成这样是防止别人程序来解析吗。。。
    SoloCompany
        2
    SoloCompany  
       2013-11-19 16:23:01 +08:00   ❤️ 1
    大哥你应该庆幸没有包含 BIG5 字符,否则你就等死吧,因为单引号是可以奇葩的合法出现在 BIG5 编码空间内的。对于现在所面临的情况,很简单,你只要使用 ISO-8859-1 编码来处理 JSON 就 OK 了,当然,转码神马的还得自己来
    cctvsmg
        3
    cctvsmg  
    OP
       2013-11-19 17:42:53 +08:00
    @SoloCompany
    @plprapper

    无语凝咽 ╮(╯▽╰)╭
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1014 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 19:57 · PVG 03:57 · LAX 11:57 · JFK 14:57
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.