Entries Tagged as '实验室'

语音搜索进入Google实验室

我们曾经介绍过Google推出的一个语音搜索小工具(gadget),它可以搜索Youtube视频当中什么人说过什么话,不过搜索的范围仅局限于Youtube的政治家频道。现在这个语音搜索实验的地位又提升了“半格”,进入Google实验室了,名字叫作“音频索引(Audio Indexing)”。

不过这个音频索引的内容并没有扩大,仍然是Youtube当中的政治家演讲,包括所有政治家(all politicians)和两位总统候选人。搜索一个关键词(英文),就会搜索出包括这个关键词的视频,这个关键词出现的位置还会用黄色块标示出来,鼠标掠过会出现文字信息。

就像上篇文章说过的那样,这个音频索引并不是“用声音来搜索声音”,而是通过语音转换文字技术,把视频中的语音先转化成文字,再用文字搜索文字。这样就使得搜索视频时,不再局限于对标题、简介和标签的检索,而是可以直接检索视频当中的内容。

Powerset小试牛刀

Powerset的“自然语言搜索(natural language search)”概念早已名声在外。前几天终于得到了测试的机会。这个2008年将要推出的搜索引擎,如今搜索的范围还仅限于英文版wikipedia。搜索的项 目还局限于“引用(quotes)”、“商业(business)”、“艺术(the arts)”、“体育(sports)”。
所谓的自然语言搜索还不能做到把自然的语言直接输入搜索框,比如“布什什么时候下台”,现在的搜索方式还是设定好的“填空式”提问,比如quotes:
who did () praise?
who did () criticize?
who criticized ()?
what did () say about ()?
……
再比如sports:
who did () sign?
what record did () break?
who beat/defeat ()?
商业和艺术的选项也是这样的方式。虽然是填空式的问句,但是显示的结果并不一定包含填到搜索框里的所有词,而是根据问句的意思来显示答案。比如who criticized (president bush)?搜索的结果有的就不包括president这个词,而只是george w.bush。这也正体现了自然语言搜索的魅力。
powerset在球队的历史战绩时非常好用,比如,who beat (arsenal)?所有打败过阿森纳队的比赛就都会呈现出来。

Powerset还有一个powermouse的功能。这实际上不是一个搜索功能,他是一个展示功能,展示powerset的运行方式,我想也是对powerset未来发展的展示。这个功能是由三个搜索框构成的:
something connection something
这其实就是powset的思维方式,现在的填空式搜索就是在已经给出connection,并由用户给出一个something来查找另一个something。而成熟的powerset应当是由用户自由的给出其中的两个要素来查找第三个要素。
总的感觉是,powerset小试牛刀,表现不错,期待中。

  • Partner links