用户名 密码 记住我 还未注册?

制作UTF-8模版中容易出现的BOM问题和解决办法 [技术论坛 - 主题综合]

XOOPS China 讨论区 > XOOPS Theme (主题) > 主题综合 > 制作UTF-8模版中容易出现的BOM问题和解决办法

正在浏览:   1 名游客



 到底部   前一个主题   下一个主题  [无发表权] 请登录或者注册



制作UTF-8模版中容易出现的BOM问题和解决办法
新进会员
注册日期:
2006/10/27 13:48
所属群组:
注册会员
帖子: 16 | 精华: 2
等级: 2; EXP: 74
HP: 0 / 43
MP: 5 / 494
离线
这个问题困扰了我很久,就是安装了xoops的某些模块比如wfdownloads,xcgal等等,用IE浏览的时候会在页面最上方出现一些空白,昨天在xoops中文社区上发文,管理员domecc帮我解答了这个问题,然后我又上网搜了一些文章,整理一下发上来,希望能给遇到这个问题的人一个参考资料吧。

在制作xoops模版的时候,如果要固定加入一些中文字符,则要theme.html保存成UTF-8编码的。而UTF-8码的文件会在文件头有三个字符的BOM,导致页面显示出现问题。

Unicode规范中有一个BOM的概念。BOM——Byte Order Mark,就是字节序标记。在这里找到一段关于BOM的说明:
引用:
在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的;如果收到FFFE,就表明这个字节流是Little- Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOM。

UTF-8编码的文件中,BOM占三个字节。如果用记事本把一个文本文件另存为UTF-8编码方式的话,用UE打开这个文件,切换到十六进制编辑状态就可以看到开头的FFFE了。这是个标识UTF-8编码文件的好办法,软件通过BOM来识别这个文件是否是UTF-8编码,很多软件还要求读入的文件必须带 BOM。可是,还是有很多软件不能识别BOM。我在研究Firefox的时候就知道,在Firefox早期的版本里,扩展是不能有BOM的,不过 Firefox 1.5以后的版本已经开始支持BOM了。现在又发现,PHP也不支持BOM。

PHP在设计时就没有考虑BOM的问题,也就是说他不会忽略UTF-8编码的文件开头BOM的那三个字符。由于必须在<?或者<?php后面的代码才会作为PHP代码执行,所以这三个字符将会直接输出。如果模版文件有这个问题,将会导致这三个字符直接输出,造成页面上方有一个小空行。国外的模版一般都是用的ASCII码的编码方式,不会有BOM,只有国内模版会由于作者的不知情造成问题。还有,大家修改模版的时候,由于输出页面使用UTF-8编码,那么修改模版的时候如果有加入中文字符的话,必须把文件转成UTF-8编码才能正常显示,这个时候如果所使用的编辑器自动加上了BOM的话,将会造成在页面上输出这三个字符,显示效果就要看浏览器了,一般是一个空行或是一个乱码。

解决的办法嘛,如果只包含英文字符(或者说ASCII编码内的字符),就把文件存成ASCII码方式吧。用UE等编辑器的话,点文件->转换- >UTF-8转ASCII,或者在另存为里选择ASCII编码。如果是DOS格式的行尾符,可以用记事本打开,点另存为,选ASCII编码。如果包含中文字符的话,可以用UE的另存为功能,选择“UTF-8 无 BOM”即可。

我使用的工具是Notepad++(推荐大家使用,开源软件,很赞的~),打开模板,格式->转化为ASCI码,保存即可。

2007/4/15 16:25
工具箱 短消息 Email PDF 书签 打印 举报 回顶部


回复: 制作UTF-8模版中容易出现的BOM问题和解决办法
高级会员
注册日期:
2004/7/16 16:12
所属群组:
注册会员
帖子: 126 | 精华: 3
等级: 10; EXP: 26
HP: 0 / 231
MP: 42 / 4169
离线
前两天才解决,也困扰了很久.

IE下页面无端端空出一行及utf8页面无法显示的解决方法
http://web2world.cn/article/2007/04/a3.html

2007/4/15 20:14
工具箱 短消息 Email PDF 书签 打印 举报 回顶部



  [无发表权] 请登录或者注册


不可查看帖子。
不可发帖。
不可回复。
不可编辑自己的帖子。
不可删除自己的帖子。
不可发起投票调查。
不可在投票调查中投票。
不可上传附件。
不可不经审核直接发帖。
不可使用主题类别。
不可使用HTML语法。
不可使用签名档。

[高级搜索]