网络日志搬家 - GB18030和GB2312
2010年11月7日
微软宣布把MSN网络日志搬家到wordpress的时候我正好在美国, 点了几下鼠标就顺利完成了搬家工作.
等我回到北京后却发现打不开https://woody1234.wordpress.com的页面, 于是决定把我的MSN网络日志手工搬迁到我的Palmmicro网络日志上来.
在一个月见缝插针的陆续工作后, 到今天我已经搬了37篇日志过来, 同时把Palmmicro.com到aredfox.spaces.live.com的链接从130个减少到了10个.
今天晚上我在检查搬家效果, 发现1/5的中文日志在我64位英文版Windows Vista下用英文版IE8看的时候偶尔会有乱码, 但是同一台笔记本下运行的Firefox和Chrome都能正常浏览.
进一步测试发现如果我把IE8菜单中的Encoding改成GB2312就能正常工作, 并且即使再次改回原来的GB18030也能显示正确.
在把我所有中文页面的meta部分中charset=gb18030改为charset=gb2312后, 所有3个浏览器都能正常看我全部的中文页面了.
网络日志搬家 - 翻译
2010年11月10日
经过过去一个月的热身, 我这3天一直在集中精力给网络日志搬家. 不过进度并不好, 虽然我已经消灭掉了最后10个Palmmicro.com到aredfox.spaces.live.com的链接, 搬家总数只从37增加到了56.
我估计还有50篇左右没有搬, 按照现在的进度还要整整8天时间.
为什么会这么慢? 主要的时间耽误在了翻译上. 大多数2009前写的日志都不是我自己翻译成中文的, 或者根本没有翻译过. 结果我现在花了大量的时间翻译它们!
我甚至做了个新页面记录常用词组的翻译.
前些时候有人问过我先写哪个语种版本, 我回答当然是英文. 要是先写中文, 就不知道该怎么翻译成英文了!
可悲的是, 从英文翻译成中文也是很不容易的, 很多中国人都跟我说他们也看不懂我的中文版本内容.
网络日志搬家 - 总结
2010年11月14日
在一个月的热身和连续8天集中日夜赶工后, 我终于把98篇网络日志从MSN空间搬到了Palmmicro网站.
不到10篇老日志被抛弃了, 主要是因为其中讨论的AR1688技术细节今天来说已经不正确.
除了增加了很多新的翻译外, 我还在不同页面间增加了很多链接, 修改了明显的错误. 要保持原样实在太不容易了, 我现在相当能理解为什么金庸要在过去30年中翻来复去的改他那15本小说.
所有原来的评论都抛弃了, 很可惜但是没有办法, 我总不能帮别人搬评论吧.
为什么不留在wordpresss.com? 答案如下:
- 实际上5月份的时候我就想把MSN空间的日志搬到公司网站了. 当时我在自己主页上开始日志, 把MSN空间做为备份. 但是巨大的搬家工作量让我犹豫不前, 很高兴微软最终帮我做了选择.
- 国内访问wordpress.com不是被封杀了就是特别慢. 而且我看不出在可以预见的将来它有什么理由不会被GFW封杀.
- 自动转换到wordpress.com的效果并不像宣传的那么好. 转换后的文本中丢失了很多' ', '\0'和'''之类的字符. 另外在中文下显示的时候, wordpress会自作聪明的把很多标点符号转换成中文版本, 让整个页面看上去蠢死了.
唐丽也在把自己的MSN空间往Palmmicro网站搬. 新加了这么多页面后, 我们网站接下来的访问统计数据估计会大大增加.
下面的图片显示了过去30天中从全世界230个城市对我们的885次访问, 共浏览了6,649个页面.
Palmmicro网页访问者使用的浏览器统计
2011年3月28日
随着IE9和Firefox4的推出, 各类浏览器的新闻再次风起云涌. 其中最令人不安的是听说360在跟GFW之父合作, 打算给中国用户提供安全的网络浏览器.
360同时在宣称, 根据百度的统计, 有18%的客户在使用360浏览器. 我使用了Google Analytics统计对Palmmicro.com的访问. 从下图中可以看到根据Google统计的Palmmicro网页访问者使用的浏览器情况.
在过去的30天中, 有1072次访问来自69个国家地区的294个城市, 总共看了6,619个页面, 跟4个月前基本上相同.
用UTF-8替换GB2312
2012年3月8日
在GB2312的伴随中长大, 过去2年中又被微软的双字节unicode搞得困惑不已, 我在绝大多数时间都没有重视过UTF-8.
可笑的是在2010年末的时候我还在比较GB18030和GB2312. 随着在过去的一年中我收到了越来越多iPad上发出来的用UTF-8编码的中文邮件, 考虑到苹果一直吹嘘它的产品的易用性, 我开始觉得UTF-8肯定很重要.
进一步的调查让我吃惊. 在我经常访问的数十个网站中, 目前仅有SMTH和天涯的论坛部分没有使用UTF-8.
为了与时俱进,我从上周末开始把Palmmicro网站从GB2312转换到UTF-8编码.
跟平常一样, 这个工作量又超过了我的预计. 我花了些时间修改Visual C++写的Woody的网站工具, 以及更多的时间学习设置VC2008的编辑器来编辑UTF-8编码的文件.
这个愚蠢的编辑器永远需要手工把文件另存为UTF-8 without signature.
再一次我抛弃了不少原来存成了GB2312编码的网络日志评论. 仍然还是一个PHP和MySQL编程新手,
我没有找到一个类似Windows下的MultiByteToWideChar函数这样简单的办法转换目前MySQL数据库中的GB2312数据, 只好用这种野蛮方式草草结束工作.