当前位置:优站分类目录 » 站长资讯 » 优化推广 » 文章详细

搜索引擎是如何分析搜索请求的?

来源:分类目录 时间:2014-12-26目录:优化推广浏览:1159次 
        一旦搜索者键入搜索请求并按卜回车键,搜索引擎便开始分析搜索请求—检查搜索请求的每个词(搜索项),并且决定怎样在搜索索引库中找到最匹配的网页。搜索引擎分析搜索请求的方式不尽相同,但有一些基本的分析技术是大多数搜索引擎所共同使用的。这些就是我们在这里要讨沦的。
   一、发现词的变体和校正拼写
   在.英语和其他西方语。,、一中;同一个词可以写成不同的“格”(写成"Glaucoma Treatments"而不是“glaucoma
treatments”})。大多数搜索引擎并不注意词的“格”,这也常常是搜索者所希望的,因为一个词在句首出现和在句中出现一样重要。偶尔,搜索者搜
索“白宫”(White House)可能是想找到与词的这个特定“格”相匹配的网页(并不是匹配这样的句子:“他住在第四街的白房子(white
house),但是搜索引擎一般都通过忽略“格”来得到更好的匹配结果。
   同样,对搜索请求中的词简单地进行精确匹配,并不总能定位到搜索者实际想要的东西。对于西方的语言来说,大多数的词都有多种形式—名词的单数和复数,动词变位—但基本上都是一个意思。许多词看起来彼此都很像:house〔房子)和houses(房子的复数)在一个句子里本质上意思是一样的,拼写也很接近。但有些同样意思相近的词,比如mouse(老鼠的单数)和mice(老
鼠的复数),看起来则稍有不同。有些动词〔例如is和were)看起来完全不同,但是意义完全一样。很多搜索引擎都知道,不管搜索请求中使用的是词的哪一
种变体,都要搜索词的所有变体,因此在搜索中mouse和mice是一样的。
  但是搜索引擎做的并不仅仅是这些。我们已经看到搜索引擎为我们校正拼写,有的时候搜索引擎只是继续执行搜索,把我们引向拼写正确的词,但也经常会询
问:“你是不是想搜索....."并且提示我们一个更常用的词语。对于搜索者很有用的功能,搜索引擎营销人员则要小心,有一些聪明的产品名字被故意设计成看起来是拼写错误的词语—自动改正的功能会将产品名称更正到止确的词语,就会造成搜索者很难找到你的产品。而且如果顾客不能正确拼写你的产品名字时,拼写校止算法无法总能奏效,所以选些人们容易拼写的名字会对你大有益处。
   二、查找词组、非词组和停止词
  词组(phrase在搜索中和在平常使用时的意义稍有不同。你也许知道,大多数网络搜索引擎允许搜索者使用双引号将几个词放在一起作为一个词来搜索。
搜索引擎称这些放在一起的词为“词组”。词组搜索者查找与搜索请求一模一样的词,包括词序在内。这种方法对于寻找特定的信息是很有用的。
   你也许不知道的是,现代的搜索引擎分析搜索请求时,即使搜索者没有使用双引号,它也会寻找词组。搜索引擎能够辨别一些经常同时出现的词,并优先选择那些同时使用这些词的网页。
  同样,许多搜索者键入一些绝非他们想要搜索的无关紧要的词,例如搜索请求写着“什么是治疗青光眼”,你可以想象,“什么是”对于找到适合的网页毫无用
处,甚至可能会误导搜索引擎去寻找含有“什么”和“是”的网页。这样的搜索项被称为“非词组”(antiphrases),会被聪明的搜索引擎所忽略(或者至少被当做是不重要的词)。
   这对于搜索引擎营销人员来说是非常重要的。因为,可能你的一个产品品牌(例如Where's
Waldo)看起来更像一个搜索者的问题而不是真正的搜索请求。搜索引擎使用其他的技术来识别像“Waldo在哪儿”这种流行的名字,但是如果你产品的品
牌没那么有名,搜索引擎就可能无法处理得很好。如果你能够避免这种会迷惑搜索引擎的做作的名字,那么最好赶紧去做。
   最后,一些词会比其他的词重要一业。极为常用的词〔例如“a”或者“the }通常被称为“停止词”( stop
word,因为在过去搜索引擎根本不会搜索它们。现代的搜索引竿时不时会注愈到这性“停止词”,例如在你子找摇滚乐队“The Who
"的时候。作为一个搜索引擎营销人员,如果能够避免在品牌和商标名称中将这些停止词作为关键词,那么这些品牌和商标就会更容易被搜索到。
   如果你为服装零售商"The
Limited”土作,恐怕就没那么容易改名字了口遗憾的足,你会发现很难获得靠前的搜索结果排序,因为即使搜索者键入的是" the limited
",Goole仍然会坚持只搜索“limited'。现在,The Limited已经是个知名的公司,因此当搜索者键入“the
limitd”的时候,很有可能找到止确的页面。但是,如果你的小公司“TheCompany",可能就没那么幸运了。而目,即使像The
Limited这样大的公司也会发现很难在某些搜索清求的结果中获得靠前的排名,例如“the limited sale"或是"the limited
Location(位置)”,因为还有很多的网页包含这此词。
      三、检查词序
   有些搜索引擎在执行搜索时会考虑同序的问题,因此当搜索例如“Little Joe”和“Joe Little”时,会出现不同的搜索结果口这些搜索引擎会尝试按照搜索请求中的词序来搜索含有同样词序的网页。
   再一次,这项对于搜索者来说是很有用的功能;对于搜索引擎营销人员来说却不总是这样。如果你的,气a}有一个不太连贯的名称如“企业管理存储系统”,就不要奇怪有些客户会将它记成是“企业存储管理系统”或是“存储管理企业系统”口所以,尽可能使你的产品有个容易按词序记住的名字,这样会有助于被搜索到。
   四、处理搜索运算特号
   有些精明的搜索者知道怎样在搜索请求里运用加减号,例如“big brother -tv"是要搜索Big Brother慈善组织而不是同样名字的电视竹目。同样,搜索者可以要求搜索结果中含有一个特定项,例如“+the white house",来避免描述自房子的句子(而且避免把the作为一个停止词忽略掉)。
  当搜索引擎变得越来越聪明,对搜索者来说,使用这些符号变得越来越不重要了,但是搜索引擎营销人员需要知道这些。如果可以选择,你会希望避免使用那些必须要运用这些符号才能获得好搜索结果的品牌和商标名称。