这是一个信息爆炸的时代,企业和个人可获取、需处理的信息量呈爆发式增长,人们对快速、方便、准确的获取到自己需要的信息的要求也越来越高,信息检索在我们的工作和生活中变得越来越不可或缺。微软公司推出的协同办公与企业资源整合利器--SharePoint 以其强大的企业门户、内容管理、搜索、Office产品无缝集成等功能为大家所熟悉。SharePoint 产品的{zx1}版本SharePoint 2010有六大功能模块:网站、社区、内容、搜索、见解和整合应用。本文的重点在于SharePoint 2010 上的企业级搜索。对于这样的一个问题,我们首先来介绍SharePoint搜索功能发展路线图,然后对SharePoint 2010 搜索架构、SharePoint 2010 搜索新功能进行介绍,{zh1}给大家展示几个使用搜索的应用与案例,以期大家对SharePoint 2010 的搜索功能有一个全新认识。
在本文中的“SharePoint 2010”,特指SharePoint 2010所有产品,实际上包含了SharePoint Foundation 2010、SharePoint Server 2010和SharePoint 2010搜索产品(详见SharePoint 2010搜索产品与架构)。SharePoint Foundation在之前的版本中,被称为Windows SharePoint Services(WSS)。SharePoint Foundation是SharePoint Server的基础构件,SharePoint Server依赖于SharePoint Foundation。如果本文中没有明确的指出,那么SharePoint 2010默认包含了SharePoint Foundation 2010和SharePoint Server 2010。
SharePoint 产品搜索功能对比
搜索功能一直是SharePoint的重要功能组件,这点由图1可以说明:
图1 SharePoint 搜索功能路线图
(1)MOSS 2003中的搜索技术:熟悉MOSS 2003的读者都知道MOSS 2003的搜索依赖于Microsoft SQL Server的全文搜索,因此MOSS 2003中的搜索准确程度和效果都受到了一些限制。
(2)MOSS 2007中的搜索技术:在MOSS 2007中实现了令人期待的独立搜索功能,这些功能包括多关键字搜索、同义词关联、设置{zj0}搜索结果、搜索结果更新通知、RSS订阅搜索结果、自定义搜索及支持内容爬网。
(3)SharePoint 2010中的搜索技术:在MOSS 2007全文检索的基础上,SharePoint 2010的搜索功能更加强大,在搜索的用户界面上提供了可视化的搜索界面;在搜索内容上,可以对服务器场、网站、列表进行搜索,还可以对组织机构中的人员和专家进行搜索,并对人员和专家建立联系;对搜索过滤功能有了增强,可以在上下文环境中进行搜索;在搜索范围上,可以使用网页、桌面、移动设备进行搜索。具体有哪些变化我们可以参考SharePoint 2010搜索新功能。
SharePoint 2010 搜索产品与架构
SharePoint 2010搜索产品不同于MOSS 2007里的搜索产品,SharePoint 2010搜索产品更加丰富与独立,包括的产品有:
? Microsoft SharePoint Foundation 2010 search
? Microsoft Search Server 2010 Express
? Microsoft Search Server 2010
? Microsoft SharePoint Server 2010
? FAST™ Search Server 2010 for SharePoint
这五个搜索产品的功能对比如表1所示:
Feature
|
SharePoint Foundation 2010 |
Search Server 2010 Express |
Search Server 2010 |
SharePoint Server 2010 |
FAST Search Server 2010 for SharePoint |
网站搜索 |
Y |
Y |
Y |
Y |
Y |
相关检索 |
|
Y |
Y |
Y |
Y |
虚拟相关检索 |
|
|
|
|
Y |
相近结果 |
|
|
|
|
Y |
复制结果 |
Y |
Y |
Y |
Y |
Y |
搜索范围 |
|
Y |
Y |
Y |
Y |
搜索结果RSS阅读 |
Y |
Y |
Y |
Y |
Y |
搜索结果警告 |
Y* |
Y* |
Y* |
Y* |
|
高级搜索 |
|
Y |
Y |
Y |
Y |
基于用户上下文搜索 |
|
|
|
|
Y |
爬网和管理属性 |
|
Y |
Y |
Y |
Y** |
实体提取 |
|
|
|
|
Y |
联合搜索 |
|
Y |
Y |
Y |
Y |
搜索建议 |
|
Y |
Y |
Y |
Y |
搜索结果的管理属性和排名 |
|
|
|
|
Y |
文档或网站相关性检索 |
|
Y |
Y |
Y |
Y** |
模糊搜索 |
|
Y |
Y |
Y |
Y |
准确搜索 |
|
|
|
|
Y |
文档预览 |
|
|
|
|
Y |
Windows 7 中的企业级搜索连接器 |
|
Y |
Y |
Y |
Y |
对人搜索 |
|
|
|
Y |
Y |
语音名字搜索 |
|
|
|
Y |
Y |
昵称检索 |
|
|
|
Y |
Y |
自定义搜索 |
|
|
|
Y |
Y |
社会检索 |
|
|
|
Y |
Y |
分类融合 |
|
|
|
Y |
Y |
多宿主 |
|
|
|
Y |
|
丰富的网页索引 |
|
|
|
|
Y |
表1 SharePoint 2010 搜索产品功能对比
由上表我们可以看到,从SharePoint Foundation到FAST™ Search Server是一个搜索功能逐渐增强的产品线,这样做的好处是可以根据企业实际需要来部署相应的产品,一方面为企业节省了成本,另一方面又为功能扩展留下了可扩展的接口。不管怎么样,SharePoint 产品的数据库是SQL Server数据库,其搜索也离不开SQL Server。SharePoint 2010 搜索架构如图2所示:
图2 SharePoint 2010搜索架构
由图2我们可以看到,SharePoint 2010搜索的核心架构包括四个部分:爬网者、索引引擎、搜索引擎、用户接口和查询对象。爬网者定义了能够爬网的对象,索引引擎对检索的内容建立索引,搜索引擎负责检索,用户接口查询对象负责响应用户操作和现实查询结果。
SharePoint 2010 搜索新功能
SharePoint 2010的搜索新功能我们分成两类用户来介绍:普通用户和管理员。
普通用户新功能
普通用户的新功能主要体现在两个方面,一方面是搜索功能本身的增强;另一方面是对搜索结果的处理,下面分别简介。
(1) 新闻检索功能
l 自由文本查询和属性查询的布尔查询语法
l 搜索关键字和文档属性的前缀匹配
l 键入搜索查询时的建议
l 用户运行查询后的建议
l Windows 7 中的企业级搜索连接器
(2) 对搜索结果的改进
l 优化面板
l 利用人员搜索,用户不仅可在组织中按姓名,还可按许多其他类别(如部门、职务、项目、专业和位置)查找其他人员
l SharePoint Server 2010 通过改进提高了搜索结果的相关性和有效性:根据搜索结果历史记录排位、基于推测的元数据关联
管理员新功能
(1) SharePoint Server 2010 具有新的管理中心界面。
(2) 服务器场配置向导在产品安装完成后自动运行,此向导可帮助简化小型服务器场的部署,搜索系统可以在服务器场配置向导完成运行后,立即对本地 SharePoint 网站(服务器场中的网站)进行爬网。
(3) 独立于其他共享服务的搜索服务管理。
(4) 对自动执行管理任务的扩展支持。
(5) 对已增加的爬网容量进行伸缩。
(6) 对已增加的吞吐量和缩短的延迟进行伸缩。
(7) 正常操作期间的拓扑管理。
(8) SharePoint Server 2010 提供了监视服务器场的操作和自定义报表的新功能。
(9) 利用运行状况和性能监视功能,管理员可以监视服务器场中的搜索操作。此功能对监视爬网状态和查询性能特别有用。
(10) 可自定义报告,它可帮助您分析搜索系统操作和调整搜索系统,以提供{zj0}搜索查询结果。
(11) 可通过爬网或联合操作在 SharePoint 网站外的存储库中搜索内容。
有关搜索新功能的更详细介绍,感兴趣的读者可以参考:
应用与案例
在应用与案例中,我们通过对搜索选项和搜索结果的展示来体验一下SharePoint 2010的企业级搜索。在搜索中心界面,我们可以选择高级搜索功能来看一看SharePoint 2010的搜索到底有什么变化,高级搜索的界面如图3所示:
图3 高级搜索
在搜索选项上增加自由文本查询和属性查询的布尔查询语法、搜索关键字和文档属性的前缀匹配,多语言支持。
SharePoint 2010的搜索从形式上可以分为两类,一类是对网站、业务数据的检索;一类是对组织机构中人员的检索。其检索的演示界面分别如图4~5所示:
图4 对网站内容搜索
在上图所示的搜索结果页面中,我们可以看到这和MOSS 2007中的搜索有了不同,首先在搜索结果页面分成了3个部分,左边是对搜索结果的分类,如结果类型、站点、作者、日期、关键字。可以通过这些分类来对搜索结果进行过滤,这是一个更加满足企业搜索需求的重大变化,假设我们需要检索Word文档,那么在搜索结果里只需要过滤结果类型是Word的即可。
在搜索结果的右端展示了相关搜索,我们知道,企业信息检索的难度在于一方面需要检索的信息来源比较分散;另一方面在于对搜索内容的相关性处理的不够友好。如根据关键字检索出了一个文档库的内容,但是我不能直接打开搜索结果的附件。在SharePoint 2010中列出了更多相关搜索,不仅如此,更增加了对多语言的支持和缩写的检索支持。
图5 对人搜索
在上图所示的搜索结果中,其界面类似于内容检索界面,对人的检索一方面提供了对搜索结果的过滤;另一方面提供了对用户信息的友好展示。同时在搜索结果本身的展示上也和网站内容检索有所不同。
总结
SharePoint 2010的搜索产品是一个功能强大的搜索平台,您可以利用常见的内置工具构建自定义搜索解决方案与搜索引擎应用程序;创建自定义搜索解决方案,来扩展诸如CRM和ERP系统等企业应用程序的用途,方便信息融合和信息导航;对多种资源进行检索,如网站、文件和文件夹、数据库等,也可以对组织的中的用户进行检索;提供了相关内容检索,并对检索结果的相关内容进行显示。不仅如此,结合VS 2010可以构建由搜索驱动的应用程序,以综合利用结构化和非结构化的内容。
IT168专稿: