管理和用户指南
对于 HTML 和 XML 文档,Net Search Extender 提供在没有定义文档模型的情况下使用的缺省文档模型。对于结构化纯文本文档,必须提供并指定文档模型。
如果使用缺省文档模型之一,则:
文档类型 | 缺省文档模型的行为 |
---|---|
HTML | 接受以下内容作为文本字段:<a> <address> <au> <author> <h1><h2> <h3> <h4> <h5> <h6> <title>。
字段名为标记名,例如“address”。 |
XML | 接受所有标记作为文本字段。
字段名为 Xpath 注释中的标记路径名,例如“/play/title”。 |
结构化纯文本(GPP) | 没有缺省文档模型。 |
Outside-In(INSO) | 接受由 Outside-In 过滤器返回的元素参数中显示的文档属性作为文本字段。字段名是 Outside-In 使用的文档属性的名称,例如:“SCCCA_TITLE”。没有任何属性支持。 |
对于每种类型的文档,都定义了文档模型。因为模型各不相同,所以为每个模型提供了示例和解释。
注意 |
---|
尽管缺省文档模型的确正确地处理文档,但为了更好地建立索引和搜索,您应该定义自已的文档模型。 借助缺省文档模型,对文档的文本全部建立索引,而不管它是否为文本字段的一部分。这意味着非限制文档搜索包括对该文本的搜索。 |