DataparkSearch 4.41 Руководство
Поисковая машина
Copyright © 2003-2006 Datapark corp.
Copyright © 2001-2003 Lavtech.com corp.
Содержание
1.
Введение
1.1.
Возможности
DataparkSearch
1.2.
Где взять
DataparkSearch
1.3.
Disclaimer
1.4.
Авторы
1.4.1.
Помощники
2.
Установка
2.1.
Требования к SQL базе даных
2.2.
Поддерживаемые операционные системы
2.3.
Инструментарий, необходимый для установки
2.4.
Инсталяция
DataparkSearch
2.5.
Возможные проблемы установки
2.6.
Регистрация установки
3.
Индексирование
3.1.
Общая информация об индексировании
3.1.1.
Конфигурирование
3.1.2.
Запуск
indexer
3.1.3.
Создание SQL-таблиц
3.1.4.
Удаление SQL-таблиц
3.1.5.
Управление подсекциями
3.1.6.
Как очистить базу данных
3.1.7.
Статистика базы данных
3.1.8.
Проверка ссылок
3.1.9.
Параллельное индекирование
3.2.
Реакция на коды HTTP-ответа
3.3.
Поддержка Content-Encoding
3.4.
Конфигурирование indexer
3.4.1.
Указание веб-пространства для индексирования
3.4.2.
Алиасы
3.4.3.
ServerTable
3.4.4.
FlushServerTable
3.4.5.
Внешние парсеры
3.4.6.
Остальные команды, используемые в
indexer.conf
3.5.
Расширенные возможности индексирования
3.5.1.
Индексирование таблиц SQL баз данных (виртуальная URL схема
htdb:
)
3.5.2.
Индексирование вывода программ (виртуальные схемы URL
exec:
и
cgi:
)
3.5.3.
Зеркалирование
3.6.
Использование syslog
3.7.
Хранение сжатых копий документов
3.7.1.
Конфигурирование stored
3.7.2.
Как работает stored
3.7.3.
Использование stored при поиске
4.
HTML-парсер в
DataparkSearch
4.1.
Tag-парсер
4.2.
Специальные символы
4.3.
META-тэги
4.4.
Ссылки
4.5.
Комментарии
4.6.
Шаблоны для индексирования
5.
Хранение данных
5.1.
SQL режимы хранения
5.1.1.
Общая инфоромация о хранении
5.1.2.
Разнообразные способы хранения слов
5.1.3.
Способ хранения single
5.1.4.
Способ хранения multi
5.1.5.
Способ хранения crc
5.1.6.
Способ хранения crc-multi
5.1.7.
Способ хранения cache
5.1.8.
Замечание о стуктуре таблиц для SQL серверов
5.1.9.
Дополнительные возможности не-CRC режимов хранения
5.2.
Способ хранения Cache
5.2.1.
Введение
5.2.2.
Структура индексов слов при способе хранения
Cache
5.2.3.
Утилиты для способа хранения
Cache
5.2.4.
Запуск способа хранения
cache
5.2.5.
Использование нескольких
splitter
одновременно
5.2.6.
Использование скрипта
run-splitter
5.2.7.
Поиск
5.2.8.
Использование лимитов при поиске
5.3.
К вопросу производительности
DataparkSearch
5.3.1.
Рекомендация использовать
searchd
5.3.2.
Рекомендация использовать файловую систему в памяти (mfs)
5.3.3.
Команда URLInfoSQL
5.3.4.
Команда MarkForIndex
5.3.5.
Производительность
MySQL
5.3.6.
Оптимизация после индексирования
5.4.
Поддержка SearchD
5.4.1.
Для чего использовать
searchd
5.4.2.
Запуск
searchd
5.5.
Oracle notes
5.5.1.
Introduction
5.5.2.
Compilation, Installation and Configuration
6.
Подсекции
6.1.
Тэги
6.1.1.
Тэги в SQL версии
6.2.
Категории
7.
Поддержка языков
7.1.
Кодировки
7.1.1.
Поддерживаемые кодировки
7.1.2.
Разные названия кодировок
7.1.3.
Перекодировка во время индексации
7.1.4.
Выбор LocalCharset
7.1.5.
Определение кодировки документа
7.1.6.
Автоматическое распознавание кодировки
7.1.7.
Кодировка документов по-умолчанию
7.1.8.
Язык документов по-умолчанию
7.1.9.
Перекодировка во время поиска
7.2.
Создание многоязычных страниц поиска
7.2.1.
Как это работает ?
7.2.2.
Возможные сложности
7.3.
Сегментеры фраз японского, тайского, корейского и китайского языков
7.3.1.
Сегментер фраз японского языка
7.3.2.
Сегментер фраз китайского языка
7.3.3.
Сегментер фраз тайского языка
7.3.4.
Сегментер фраз корейского языка
7.4.
Поддержка мультиязычных веб серверов
8.
Поиск документов
8.1.
Использование поисковых фронт-эндов
8.1.1.
Осуществление поиска
8.1.2.
Параметры поиска
8.1.3.
Изменение весов различных частей документов во время поиска
8.1.4.
Использование фронт-энда на страницах с SSI
8.1.5.
Использование нескольких шаблонов
8.1.6.
Булев поиск
8.1.7.
Как используются при поиске устаревшие документы
8.2.
Модуль
mod_dpsearch
для Apache httpd
8.2.1.
Для чего использовать
mod_dpsearch
8.2.2.
Конфигурирование
mod_dpsearch
8.3.
Как создавать шаблоны результатов поиска
8.3.1.
Секции шаблона
8.3.2.
Секция Variables
8.3.3.
Включения в шаблонах
8.3.4.
Условные операторы в шаблонах
8.3.5.
О безопасности
8.4.
Дизайн search.html
8.4.1.
Как создаётся страница результатов
8.4.2.
Ваш HTML-шаблон
8.4.3.
О формах
8.4.4.
Относительные ссылки в search.htm
8.4.5.
Добавление формы поиска на другие страницы
8.5.
Релевантность
8.5.1.
Упорядочивание документов
8.5.2.
Расчёт релевантности
8.5.3.
Рейтинг популярности
8.5.4.
Булевы запросы
8.5.5.
Crosswords
8.5.6.
Алгоритм Построения Рефератов (SEA)
8.6.
Регистрация поисковых запросов
8.7.
Кэш результатов поиска
8.8.
Нечёткий поиск
8.8.1.
Ispell
8.8.2.
Aspell
8.8.3.
Синонимы
8.8.4.
Поиск без учёта акцентов над буквами
8.8.5.
Акронимы и аббревиатуры
9.
Разное
9.1.
Сообщение о багах
9.1.1.
Посметрные дампы
9.2.
Использование библиотеки
libdpsearch
9.2.1.
Скрипт
dps-config
9.2.2.
DataparkSearch
API
9.3.
Структура таблиц базы данных
Предметный указатель
Список таблиц
3-1.
уровни подробности сообщений indexer'а
5-1.
Типы лимитов способа хранения Cache
7-1.
Кодировки и их языковые группы
7-2.
Синонимы наименований кодировок
8-1.
Параметры поиска
8-2.
Параметры расчёта релевантности, задаваемые при компиляции (ключи для
configure
)
9-1.
Структура таблицы
server
9-2.
Значения некоторых параметров серверов в таблице
srvinfo
След.
Введение