采用 HTML 或 XML 格式的文档是结构化文档的示例,它们包含用来标识文本字段和文档属性的标记。文本字段可以包含一些类似于文档的标题、作者或描述之类的信息。文档属性可以包含数字。
以下是从结构化纯文本文档中抽取的一部分。 它包含由类似于 HTML 的标记定界的字段和属性。
[head]Handling structured documents [/head] [abstract]This document describes the concept of structured documents and the use of document models to... [/abstract]: :
当 Net Search Extender 为结构化文档创建索引时,它必须识别结构才能为文本字段和属性创建索引, 并将它们与用来标识包含它们的字段或属性唯一名称存储在一起。这使得 Net Search Extender 能够在特定文本字段中有选择地搜索,或者查找具有特定属性的文档。
为了使 Net Search Extender 能够了解特定文档格式的结构,必须将文档模型中结构的定义传递给 Net Search Extender。
当调用 CREATE INDEX 命令来为文档创建索引时,将文档模型的名称指定为自变量。
在您可以使用文档模型来为文档创建索引之前,必须首先定义文档模型,然后将文档模型添加到索引中。