百度阿拉丁平台推出来了(alading.baidu.com),盛传之下让人大跌眼镜,百度大肆宣扬的新技术平台原来只是一个人工填词的山寨google box,而且让人倒胃的是百度采用了和百度指数类似的人工添加指数关键词的人肉搜索机制,而并非自己的技术和数据挖掘。

bjcg

上面是目前百度搜索“北京餐馆”的网页搜索结果第一页,下面图是谷歌中文的搜索结果第一页,看到百度的结果还处于传统搜索阶段,谷歌中文的搜索则已经把地图搜索、评论等有效生动结合了,谷歌向我们展示的是:网页搜索的结果并不是只会显示文本。

bjcg2

google box 是李开复2007年提出的谷歌整合搜索策略,当然中国雅虎张忆芬也提出了中国雅虎整合搜索的设想,李开复说的谷歌整合搜索和张忆芬说的雅虎整合搜索不是一回事,李的整合搜索概念是要智能化、多样化、综合在左侧结果中,张的整合搜索概念则是在视觉效果上突出立体感、直观性、模块化。目前,谷歌中国和中国雅虎的整合搜索都推出一年多了,百度阿拉丁事实上已经非常落后了,从阿拉丁网页上描述来看,百度的整合搜索面临着数据结构的设计问题。多元化数据通过机器人智能展现在网页搜索结果中,并且按照信息的重要性、新鲜度、相关性来排列顺序,这是整合搜索的基础数据构架难点,这对于百度来说,可能意味着要对原来的数据结构做大规模的变动,这带来的负载和计算压力会指数上升,甚至意味着百度要彻底换芯。

我们为什么需要云计算?

如果我们通过人工就可以组织我们世界的信息,那么我们肯定没必要去研究什么云计算,更没必要去发展什么超级计算机,我们之所以需要搜索引擎是因为地球上的信息通过人脑已经不足以检索和控制,所以,搜索引擎必然是越来越智能、越来越客观,因为我们研究技术是为了人类服务而不是让人累。

我们现在挖水库用挖掘机了,在解放初期挖水库都是人工挑,我爸爸那个年龄的人就经历过了,技术是用来解放人的,云计算就是为了解放人、也解放PC的技术。云计算并不是人工分享,而是通过技术去静悄悄地为人们服务,而不需要人们去做复杂的工作,把人肉搜索理解成云计算有些无理取闹,是忽悠人的卑鄙技俩。

百度阿拉丁的人工填词

百度指数的人工填词策略有好处,也有坏处,好处是技术压力少很多,坏处是人为机器服务了,也就是说本末倒置了。百度阿拉丁所说的结构化数据是有道理的,这个典型就是wiki,而百度已经有了百科,其他那些实用的结构化数据完全是长尾的,如果通过人工填词的方式来做显然是太片面的,根本满足不了越来越个性化的用户需求,所以,通过数据分析和挖掘、智能地挖掘出词更符合搜索发展。

人工填词降低了实现门槛,同时也降低了对手超越的门槛,搜搜、有道们完全可以copy,如果马化腾一两年后不甘寂寞了,凭借QQ的用户量和技术积累,很容易形成百度的威胁。就好象我们可以山寨一个手机、一个pc,但是我们山寨了多少操作系统、山寨了多少cpu?

笔者最后一句话要说:百度的核心竞争力已经严重动摇了。

6 Comments
  1. 坏蛋 10年 ago

    百度杀手柳华芳同志是一见百度就眼睛发绿啊

  2. geo898 10年 ago

    好文收藏!

    但是,百度的改进还是应该支持的,关于人工填词我理解成对内容打标签,就像stumbleupon等服务那样,应该有积极的意义。

    看到阿拉丁的新闻,我也发表了一点看法:http://www.gooseeker.com/cn/node/Fuller/2009042202

    虽然不够专业,但是,我更愿意期待百度还有杀手锏没有亮出来

  3. 红火 10年 ago

    google那个明显是站内搜索,百度完全可以做到

    • 坏蛋 10年 ago

      可不是站内搜索 数据跨域调用和整合很麻烦的

  4. 赵中捷 10年 ago

    每次来都是一次深刻的学习,谢谢!

  5. aswand 9年 ago

    百度确实已经落后谷歌许多,反过来,假如百度和谷歌位置对调,恐怕百度的市场份额连10%都不会有。

Leave a reply

电子邮件地址不会被公开。 必填项已用*标注

*

This site uses Akismet to reduce spam. Learn how your comment data is processed.

联系

微信ruinews360 微信公众号:小芳侠

Sending

Log in with your credentials

Forgot your details?