Яndex.Server 3.8 Free Edition : Документация для разработчиков и администраторов | ||
---|---|---|
Пред. | Глава 4. Модули индексатора, входящие в комплект поставки | След. |
Анализатор содержимого документа - парсер ппредставляет собой модуль, реализующий специальный программный интерфейс . Основная задача парсера - выделить из документа нужный для индексирования текст. Текст, выделяемый парсером, может быть помечен как принадлежащий определенной зоне документа, или как имеющий определенные свойства (атрибуты). На основании элементов форматирования документа парсер может указать границы предложений и абзацев, а также вес данного отрывка текста.
Ниже приведена таблица модулей стандартных парсеров поставляемых с Яndex.Server 3.8 Free Edition
Таблица 4-2. Стандартные парсеры Яndex.Server 3.8 Free Edition
медиа-тип/подтип (MimeType) | библиотека парсера | конфигурируемый | ||
---|---|---|---|---|
Windows | Unix | |||
text/plain | встроенная | встроенная | нет | |
text/html | встроенная | встроенная | нет |
Пред. | Начало | След. |
Индексирование веб-страниц | Уровень выше | Настройка и использование поискового сервера |