1、用户根据需求搜索关键词,可以是长关键词,比如雪纺连衣裙长裙。可能是短关键词,比如连衣裙。也有可能是一些无聊的关键词,比如什么东西好吃,怎么找女朋友等等。
2、当用户把搜索关键词提交到淘宝的时候,淘宝会对这些关键词进行分析,也就是分词。淘宝会对这个关键词进行分析,这个分析涉及的关键词粒度的大小(粒度是指数据的精准程度),那么关键词粒度又是怎么来分的呢?这个就会涉及到分词里面的词义分词法,词义分词法的意思是进行句法丶语义分析,利用句法信息和语义信息来处理歧义现象来分词。(目前这个技术还不是绝对成熟,但是阿里已经使用很久了),比如上面讲到的雪纺连衣裙长裙这个关键词。淘宝把这个关键词分成这样:雪纺,连衣裙,长裙。当然,分词远不止这么简单,而只是我们说到的分析的一部分,比如这个搜索的很奇葩是不是?如果遇见这样的关键词,淘宝会对通过上面我们说到的词义分词法,对这个关键词进行分析处理,去掉那些干扰信息,比如搜索:什么核桃好。以上是对分词简单解释,当然分词功能远不止这些,但是执行方法都基本差不多。
3、关键词分析分词完成后,开始进行文本匹配。文本匹配是搜索引擎用已经分好的词,在淘宝的后台去匹配,看看那些宝贝使用了这些分词好的关键词,根据文本匹配,如果有使用了分词好的关键词,就有获得了检索的机会,那么这地方就会有人问,有紧密关联吗?就我目前对的了解,紧密关联,以及空格字符等等,对匹配的结果影响不大,原因是因为在分词的时候,淘宝已经完成了这个动作。还有一个问题,比如看这个:雪纺连衣裙长裙。我们搜索的关键词中并没有“女”字,但是却在结果中出现了,但是并不是每个标题都有女字,这是什么原因呢?这是淘宝分析的结果。搜索引擎发现搜索这个关键词的的人,都是在女装类目下面,如果你的整个标题里面有女字,淘宝会标红,如果没有,没有关系,搜索引擎在文本匹配的时候匹配了类目。有时我们发现用户搜索了一些关键词,但是我们的标题中没有,也会获得展现,这个是搜索引擎匹配了属性,你的属性中标明了这个关键词表达的意思。
4、匹配好了之后,要返回结果,这个时候,上下架时间发挥了作用,因为搜索引擎的轮播机制,如果用户搜索的关键词经过搜索引擎分词后,发现有很多宝贝,这个时候就要涉及到排队展现的情况,如果在文本匹配的情况下,如果你正好快要下架了,这个时候正好有用户搜索了你的关键词,那么你就获得参与展现的机会,但是这里还有一个门槛,就是权重,这个权重涉及到转化,点击率,人气等,这些值越高,理论上来讲,你的权重就越高,展现的位置也就越靠前。