一个用了古爱尔兰语命名,并且index了世界上最多页面的搜索引擎-Cuil出现在了世人面前。看了一下它的features,基本上没有带来任何惊喜,query suggestion,result classification都是已经出现在其他搜索引擎中的技术。
虽然号称index了最多的页面,但并不代表用户就可以得到他想要的结果,high recall but low precision is
trivial,用户没有那么多的时间和耐心去一个一个去点击查看哪些页面符合自己的要求,Searchme比Cuil好的地方就在于它降低了检查页面的成本。但是他们共同的问题是precision都不是那么的高。
现 在想要做一个大而全的搜索引擎和google,yahoo们竞争几乎不可能成功,这是一个需要创新但也需要积累的领域,绝不是简单的pagerank就能 解决一切,paperank可以过滤不好的页面,可以让有价值的页面拥有更高的rank,但这只解决了问题的一面,keyword search 是一种充满ambiguity的搜索模式,用户的intention很难通过几个关键字就清楚的表达出来。因此如果一个搜索引擎无法相对准确的分析出用户 的intention,搜索结果的precision很难提高。然而分析用户的intention是需要长期积累大量的数据、分析语义以及人的搜索行为, 并且不断的进行refine才能做到的,而且人的intention会随着时间而evolve。至少目前来看,Cuil的积累还不够,并且目前 research在语义这一块还不怎么成熟。其实如果一个新的搜索引擎focus on某一特定的领域或是用户群,那成功的几率或许会高些。
最后对于Cuil,我更感兴趣的是Cuil这个词该如何读呢?
现 在想要做一个大而全的搜索引擎和google,yahoo们竞争几乎不可能成功,这是一个需要创新但也需要积累的领域,绝不是简单的pagerank就能 解决一切,paperank可以过滤不好的页面,可以让有价值的页面拥有更高的rank,但这只解决了问题的一面,keyword search 是一种充满ambiguity的搜索模式,用户的intention很难通过几个关键字就清楚的表达出来。因此如果一个搜索引擎无法相对准确的分析出用户 的intention,搜索结果的precision很难提高。然而分析用户的intention是需要长期积累大量的数据、分析语义以及人的搜索行为, 并且不断的进行refine才能做到的,而且人的intention会随着时间而evolve。至少目前来看,Cuil的积累还不够,并且目前 research在语义这一块还不怎么成熟。其实如果一个新的搜索引擎focus on某一特定的领域或是用户群,那成功的几率或许会高些。
最后对于Cuil,我更感兴趣的是Cuil这个词该如何读呢?

Recent Comments