文档模型允许您将文档部分或节标识为属于特定文本字段和/或标识为文档属性。
对文档的文本全部建立索引,而不管它是否为文本字段的一部分。当文档模型将文本标识为属于文本字段时,将认为该文本是文档的文本内容的一部分,并通过正常方式建立索引。即,将有意义的词条抽取并存储在索引中。这意味着非限制文本搜索包括对该文本的搜索。
在此情况下,可以在特定字段中有选择性地搜索文本。例如,可以在文本字段 Abstract 中搜索包含单词 structure 的文档。
文本字段可以在文档中多次出现。例如,可以定义一个包含所有图形标题的文本字段。一个文本字段还可以覆盖另一个文本字段。
如果想避免为某些文本字段的内容创建索引,可以指定包含 exclude="YES" 的字段定义。可以在文本字段和文档属性的限制中查找文本字段和文档属性的限制的列表。
文档属性包含类型为 number 的简短格式化信息。可以使用值范围来搜索包含这些属性的文档。
属性不是与已建立索引的文本存储在一起的,而是存储在一个单独的项索引中。因此,要按属性的内容来搜索文档,必须对属性显式地进行属性搜索。
Net Search Extender 提供了一个识别浮点数的解析器。下面是整数值的正确和不正确格式的一些示例。
正确格式 | 不正确格式 |
---|---|
1000 1 000 1.000 - 句点是一个十进制字符 |
1,000 |
100 000 100 000.00123 |
1 000 000 - 1 和 0 之间存在两个空格 |
注意,在一个数字的十进制小数中不允许存在空格字符。例如,1 000.000 100 将被当作两个数 1000.000 和 100 来对待。
不支持特定于语言的分隔符和特定于语言的货币格式。