导航

Baiaogo

与搜索引擎同行,与SEO,SEM,UCD相伴,Baiaogo走在互联网的大道上!

« 点石互动第2届SEO大赛开始了!百奥谷现象被百度收录 »
目前位置:首页>>问题与讨论>>百奥谷在YAHOO的分词规则

百奥谷在YAHOO的分词规则

今天在YAHOO上关于“百奥谷”的一点发现,百奥谷在YAHOO的分词规则
先看下图:




看到图中的搜索关键字是“百奥谷”吧!
那再看下图的形式,发现什么问题没有?

****************************************************

百奥谷非彼百奥谷-百奥谷现象

反正就写一童话形式的吧,要不然就扯篇小说出来,每天一集,写到百奥谷结束,到时候出本书,拿来送朋友,哈哈! 书名:《百奥谷奇遇记》...最终百奥谷经过自己的历练,环游世界回到了中国看到了奥运会。 以后就开始此百奥谷非彼百奥谷,...  

www.baiaogo.cn   7天前   快照  

**************************************************

再一个看标题显红位置有三处,分词是这样的:百奥、百奥谷、百奥谷

TODO猜想了一下,估计第一个分的时候有点误解,不知道怎么分,然后第二个估计是因为有个“-”符号隔断,蜘蛛直接从这里分词,毕竟不可能组分成这样“彼百”“奥谷”。

很明显,所以接下来的描述部分,也是这样的:“以后就开始此百奥谷非彼百奥谷,...”
与标题的分词一模一样,也有可能YAHOO对这种表达式不能读懂,因为如果能读懂,蜘蛛应该判断从“”字分前后,也就是“”字为一个停止词,在它的前后进行分词,然后到“非彼”的时候再将“非彼”看作一个停止词,在它的前后进行分词,如果这样一来,这句话就不会被读成这样了。

不知道YAHOO的蜘蛛有没有识别表达式的能力,估计现在谷歌、百度也还没有做到吧,至少TODO并没有发现的!

因为前面已经将“百奥”分在一起,那么后面的两个“百奥谷”是很明显的“-”符号的作用,因为“百奥谷现象”中的“现象”是肯定会直接分成一组的,这个词太容易判断了!

假如回过头来再想一下,如果“-”符号是一个连词,那么可能YAHOO的蜘蛛就要更郁闷了,比如:此百奥谷非彼百奥谷与百奥谷现象

不知道YAHOO会怎么样去分它,TODO认为这个“与”字如果YAHOO都不能识别进行断词,那么就真是太搞笑了!你说呢?有想法就一起来讨论一下,发表你的评论吧!

除特别标注外,本站文章均属原创,转载时请按以下格式注明出处:
作者TOD

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Copyright 与搜索引擎同行-Baiaogo BaiAoGo.cn. Some Rights Reserved. By:TOD

Search

控制面板

最新评论及回复

最近发表

网站收藏