IBM Books
(C) IBM Corp. 2000, 2003.

Net Search Extender

管理和用户指南

缺省文档模型

对于 HTML 和 XML 文档,Net Search Extender 提供在没有定义文档模型的情况下使用的缺省文档模型。对于结构化纯文本文档,必须提供并指定文档模型。

如果使用缺省文档模型之一,则:


表 6. 受支持文档格式的缺省文档模型的行为

文档类型 缺省文档模型的行为
HTML 接受以下内容作为文本字段:<a> <address> <au> <author> <h1><h2> <h3> <h4> <h5> <h6> <title>。
字段名为标记名,例如“address”。
XML 接受所有标记作为文本字段。
字段名为 Xpath 注释中的标记路径名,例如“/play/title”。
结构化纯文本(GPP) 没有缺省文档模型。
Outside-In(INSO) 接受由 Outside-In 过滤器返回的元素参数中显示的文档属性作为文本字段。字段名是 Outside-In 使用的文档属性的名称,例如:“SCCCA_TITLE”。没有任何属性支持。

对于每种类型的文档,都定义了文档模型。因为模型各不相同,所以为每个模型提供了示例和解释。

注意

尽管缺省文档模型的确正确地处理文档,但为了更好地建立索引和搜索,您应该定义自已的文档模型。

借助缺省文档模型,对文档的文本全部建立索引,而不管它是否为文本字段的一部分。这意味着非限制文档搜索包括对该文本的搜索。


[ 页的顶部 | 上一页 | 下一页 | 目录 | 索引 ]