Big Fish

2007-04-11

sogou和baidu

不好意思让大家失望了,这篇我要说的事情跟现在沸沸扬扬的拼音门事件毫不相关。

今年1月的时候,我对搜索引擎的使用情况是:地图搜索用baidu音乐搜索用sogou其它都用google

不过1月底我开始改用Camino浏览器,这个时候我发现,Camino的搜索拦只能以utf-8编码发送url。而sogou和baidu作为国产搜索引擎,非常具有中国特色的只支持gbk作为url编码[1][2]。与之对比的是,google允许你指定你在url上使用的编码[3]

这样导致的结果是我无法直接在Camino的搜索栏上对sogou音乐或者baidu地图使用中文关键词。于是我对贵系的各位sogou员工和baidu员工feedback了一下。

转眼2个月过去了。在上周的catod生日饭局上,sogou音乐搜索团队的领导者王老吉同学终于兴奋的向我宣布sogou音乐的utf-8编码url支持加上了。不过他当时没告诉我具体的参数是什么,我昨天才在msn上找他问到[4]

而baidu地图那边,PM a梦同学据说是向他们的RD提出了这一request,但是却被RD以别的工作太多为由给拍回来了。总之就是,他们现在还没给我feedback。而在这2个月期间,google大大改善了其地图数据,与baidu地图对比已经没有明显劣势了。所以昨天我修改了一下我Camino的搜索拦,把sogou音乐搜索改成了utf-8的,而删掉了baidu地图搜索。

所以目前我对搜索引擎的使用情况是:音乐搜索用sogou,其它都用google。

注:

[1]: URL里面的编码是指url里面包含非latin-1的内容(比如中文)的时候如何对url进行编码。这个编码无法在http协议里面指定,所以只能网站服务器和访问者协商规定一个统一的编码。问题就在这里:不是所有的网站服务器都使用同样的编码 (utf-8 rules!)。

[2]: baidu的网页搜索其实是支持utf-8 url的,我从我的blog的referral里面发现的,比如这个。但是baidu没有在任何地方说明这个参数,所以我不知道地图搜索是否有类似的参数,但是问了相关人员回答是没有。

[3]: 搜到一个说明在这里。顺便鄙视一下google,w3c现在已经不允许用“9”作为id了。

[4]: 这是一个例子

14:15:27 by fishy - Permanent Link

May the Force be with you. RAmen