文档模型如何描述结构化文档

采用 HTML 或 XML 格式的文档是结构化文档的示例,它们包含用来标识文本字段和文档属性的标记。文本字段可以包含一些类似于文档的标题、作者或描述之类的信息。文档属性可以包含数字。

以下是从结构化纯文本文档中抽取的一部分。 它包含由类似于 HTML 的标记定界的字段和属性。

[head]Handling structured documents
[/head]

[abstract]This document describes the concept of structured documents
and the use of document models to...
[/abstract]:
:

当 Net Search Extender 为结构化文档创建索引时,它必须识别结构才能为文本字段和属性创建索引, 并将它们与用来标识包含它们的字段或属性唯一名称存储在一起。这使得 Net Search Extender 能够在特定文本字段中有选择地搜索,或者查找具有特定属性的文档。

为了使 Net Search Extender 能够了解特定文档格式的结构,必须将文档模型中结构的定义传递给 Net Search Extender。

当调用 CREATE INDEX 命令来为文档创建索引时,将文档模型的名称指定为自变量。

在您可以使用文档模型来为文档创建索引之前,必须首先定义文档模型,然后将文档模型添加到索引中。