Powerset小试牛刀
Powerset的“自然语言搜索(natural language search)”概念早已名声在外。前几天终于得到了测试的机会。这个2008年将要推出的搜索引擎,如今搜索的范围还仅限于英文版wikipedia。搜索的项 目还局限于“引用(quotes)”、“商业(business)”、“艺术(the arts)”、“体育(sports)”。
所谓的自然语言搜索还不能做到把自然的语言直接输入搜索框,比如“布什什么时候下台”,现在的搜索方式还是设定好的“填空式”提问,比如quotes:
who did () praise?
who did () criticize?
who criticized ()?
what did () say about ()?
……
再比如sports:
who did () sign?
what record did () break?
who beat/defeat ()?
商业和艺术的选项也是这样的方式。虽然是填空式的问句,但是显示的结果并不一定包含填到搜索框里的所有词,而是根据问句的意思来显示答案。比如who criticized (president bush)?搜索的结果有的就不包括president这个词,而只是george w.bush。这也正体现了自然语言搜索的魅力。
powerset在球队的历史战绩时非常好用,比如,who beat (arsenal)?所有打败过阿森纳队的比赛就都会呈现出来。
Powerset还有一个powermouse的功能。这实际上不是一个搜索功能,他是一个展示功能,展示powerset的运行方式,我想也是对powerset未来发展的展示。这个功能是由三个搜索框构成的:
something connection something
这其实就是powset的思维方式,现在的填空式搜索就是在已经给出connection,并由用户给出一个something来查找另一个something。而成熟的powerset应当是由用户自由的给出其中的两个要素来查找第三个要素。
总的感觉是,powerset小试牛刀,表现不错,期待中。
[…] Google调研总监(a director of research at google)Peter Norvig 接受了Technology Review的采访,其中一段是谈到对自然语言搜索(整句搜索)的看法,这是Powerset们正在努力研究的事情。下面是采访的原文: […]
[…] 感官上最大的区别是,powerset终于脱离了powerset labs时代的填空式搜索,只要在搜索框中填写词或句子就可以搜索了。在搜索框下面有一些现成的例词、例句,可以先看一下。我选择了这个“who did google acquire(google收购了谁)” ,来看看搜索结果,见下图。 […]