第818章搜索习惯
go搜索提供的这个官方標记,直接切中了商务人士和普通网民对信息真实性的需求。
只要是存在於网际网路上的公开网页,似乎没有go搜索查不到的內容。
加州伯克利分校的计算机实验室里,埃里克正在研究go搜索的排序逻辑。
他在搜索框里输入了几个c语言相关的生僻词汇,看著返回的结果列表。
他们的爬虫程序抓取范围非常广。
埃里克对身后的室友陈述著观察结果。
只要是公开发布在网际网路上的网页,几乎都能被收录。
而且排序机制很清晰。
室友凑近屏幕看了一会儿。
目前的检索匹配机制还无法应对比较复杂的自然语言长句。
室友指出其中的技术局限。
如果你输入一个完整的长疑问句,系统只会把句子拆解成独立的词汇,然后去匹配包含这些单词的网页,结果会有一定的偏差。
但这已经足够了。
埃里克切换了几个不同的搜索词。
对於现阶段的网民来说,精確的单词相关匹配才是最常用的需求。
只要关键词输入准確,相关程度最高的网页就会排在最前面。
几乎没有疏漏。
更重要的是他们对大企业和重要网站的处理方式。
埃里克输入了微软的英文名称。
排在第一的是微软的官方网站,带有显眼的官方標记和所属公司全名。
排在后面的才是各种技术论坛里討论微软系统漏洞的新闻和帖子。
这避免了近似信息的干扰。
埃里克指著那个官方標记。
技术上实现这种权重倾斜不难,难的是如何確认这个网站背后的实体身份。
红木城,硅谷在线总部。
弗兰克坐在会议室的主位上。
长桌两侧坐著搜索业务部的负责人和审核团队的主管。
投影幕布上显示著搜索请求量的增长曲线。
伴隨门户网站日均一亿次以上的点击量,搜索框的使用频次正在呈指数级上升。
搜索业务负责人做著常规匯报。
用户已经习惯了在找不到特定信息时,直接使用我们的搜索功能。
这是目前市面上响应速度最快、收录最全的搜寻引擎。
弗兰克看著数据报表,微微点头。
审核团队的主管隨后发言,语气中带著明显的疲惫。
马歇尔先生,人工审核部门的压力已经达到了极限。