缺省文档模型

对于 HTML、XML 和 Outside In 的已过滤文档, Net Search Extender 提供在没有定义文档模型的情况下使用的缺省文档模型。 对于结构化纯文本文档,必须提供并指定文档模型。

如果使用其中一种缺省文档模型,则:

表 7. 受支持文档格式的缺省文档模型的行为
文档类型 缺省文档模型的行为
HTML 接受以下内容作为文本字段:<a> <address> <au> <author> <h1><h2> <h3> <h4> <h5> <h6> <title>。
字段名为标记名,例如“address”。
XML 接受所有标记作为文本字段。
字段名是全限定标记路径名,例如,“/play/title”。
结构化纯文本(GPP) 没有缺省文档模型。
Outside In(INSO) 接受由 Outside In 过滤器返回的元素参数中显示的文档属性作为文本字段。字段名是 Outside In 使用的文档属性的名称,例如:“SCCCA_TITLE”。

对于每种类型的文档,都定义了文档模型。因为模型各不相同,所以为每个模型提供了示例和解释。

注意

尽管缺省文档模型的确正确地处理文档,但为了更好地建立索引和搜索,您应该定义自已的文档模型。

借助缺省文档模型,对文档的文本全部建立索引,而不管它是否为文本字段的一部分。这意味着非限制文档搜索包括对该文本的搜索。