2010-03-21 20:19:00 阅读13 评论2 字号:大中小
为了让搜索引擎能够正确识别以英文形式命名的URL中的关键字,我们需要使用相应的符号对词组之间的单词进行分隔,常见的分隔符包括:空格“ ”、横杠“-”、下划线”_”、逗号“,”及加号“+”等。
例如,搜索引擎并不能识别“digitalcamerabattery”,因为这个单词在搜索引擎的切词系统中是不存在的,但却可以识别“digital camera battery”或者“digital-camera-battery”。
常见分隔符
在URL中,很多符号都具有分隔符的意义。例如横杠“-”、加号“+”、下划线“_”、逗号“,”、空格“ ”及斜杠“/”等,但这些符号在URL中所起的作用及表达的意义是不一样的。不仅不同的分隔符在URL中所起的作用不一样,即使是同一分隔符在不同的搜索引擎里表达的意义也会有所差别。
接下来将重点介绍常见的分隔符:横杠“-”、下划线“_”、空格“ ”及斜杠“/”。
空格与横杠
在有些搜索引擎里,把URL中的横杠“-”与空格符“%20”都当作空格符处理(URL中“%20”就是空格)。例如在Google中,以下关系是成立的:
camcorder-battery == camcorder battery == camcorder%20battery
下面我们验证一下。以“camcorder battery”为例,在Google中搜索“allinurl: camcorder battery”,可以看到以加号“+”、横杠“-”及空格符“%20”作为URL中单词间分隔符的搜索结果,如图4-5所示。
图4-5 “allinurl: camcorder battery”搜索结果
{dy}条搜索结果中的“camcorder-battery”与第二条搜索结果中的“camcorder%20battery”在Google中表达的意义是相同的。
q 横杠“-”。对于分隔符的使用,我们可以在域名的命名规则上得到启发。例如在申请一个域名时,我们只能使用横杠“-”而不是下划线“_”或者空格“ ”作为分隔符。由此,我们可以推测对于搜索引擎来说,横杠“-”比空格“ ”及下划线“_”更加友好。
q 空格“ ”。不管是在浏览器还是搜索引擎中,URL中“%20”字符表达的就是空格的意义,但这不利于普通用户对URL的理解及记忆。用户不喜欢的东西,难道搜索引擎会喜欢吗?如图4-6及图4-7所示。
搜索引擎索引效果:
图4-6 搜索结果中空格的表现形式
浏览器URL显示效果:
图4-7 浏览器中空格的表现形式
下划线“_”
下划线“_”也是URL中单词间的一个有效的分隔符号。在有些搜索引擎里,也会把下划线“_”当作空格处理,如图4-8所示。
图4-8 使用下划线“_”作为分隔符的URL
也就是说,以下的关系是成立的:
"camcorder_battery == camcorder battery == camcorder-battery";
但是,在“allinurl: camcorder battery”的搜索结果中,只有极个别的URL使用下划线“_”,这从一定程度上说明,在搜索引擎中下划线“_”作为单词间分隔符的影响力远不如空格“ ”及横杠“-”。
斜杠
斜杠“/”是URL中的自然分隔符。但是,斜杠只能作为URL中目录之间或者目录与文件名之间的分隔符,而不能作为目录名称或者文件名称内部的分隔符。在4.7节里,将会详细介绍如何利用斜杠对“目录间”或“目录与文件间”的名称进行分隔与组合。