Internet Spider

Internet Spider является высоко эффективным решением, которое позволяет получать информацию с заданных узлов сети Internet/Intranet, сканируя неограниченное число узлов, и извлекая оттуда данные из мультимедийных и текстовых документов с заданными характеристиками по интересующей тематике с применением средств авторубрикации.

Полученная таким образом информация автоматически индексируется при помощи Convera RetrievalWare.

При конфигурировании Internet Spider пользователь определяет такие параметры сканирования и индексации, как тип документа (pdf, HTML, графические и мультимедийные файлы), каталог, сайт, домен, а так же задает глубину, ширину и частоту сканирования.

В процессе сканирования Internet Spider создает и поддерживает специализированную базу данных, в которой могут сохраняются как сами документы, так и ссылки на них.

Convera Internet Spider может поддерживать защищенные Internet-соединения и индексировать узлы Internet, находящиеся за пределами брандмауэра. Возможен автоматический ввод идентификатора и пароля пользователя для страниц Internet с контролем доступа.

Convera Internet Spider способен работать с любыми объемами узлов - от корпоративной интрасети до внешних узлов Internet. На многопроцессорных машинах критичные по времени процессы выполняются параллельно на нескольких процессорах. Возможна работа в многосерверной конфигурации.

Имеются реализации для платформ Windows NT и Sun Solaris.

Таким образом, Internet Spider предоставляет пользователю возможность эффективной навигации в сети Internet, поиск и избирательное получение файлов различных форматов, что позволяет достаточно гибко управлять процессом мониторинга сайтов.