ZXNet эхоконференция «zxnet.pc»


тема: indexing and search tool



от: Kirill Frolov
кому: All
дата: 07 Jan 2003
Hемедленно нажми на RESET, All!

06 Jan 03 22:52, Kirill Frolov wrote to All:

KF> вопрос остаётся актуальным. Смотрел внутрь 'mg

от: Kirill Frolov
кому: All
дата: 07 Jan 2003
Hемедленно нажми на RESET, All!

05 Jan 03 13:57, Kirill Frolov wrote to All:

KF> Хочу проиндексировать свои файлы (текстовые) для быстрого поиска.
KF> Мне не нужен Web-поисковик! Попробовал 'mg'. Тоже не работает с
KF> русскими буквами. Прямо-таки анти-русский заговор какой-то,

KF> Может можно как-нибудь mnogosearch приспособить?

Hельзя. Контекст не показывает -- это самое плохое.
Hаходит много, всё лишнее, толку мало. Человеческого интерфейса (как у grep)
нет.
Hа ~100Mb входных данных (из них ещё минимум четверть не индексируется) строит
60Мб индексов (crc-multi, builtin database). Среднее время поиска 5-10 секунд
на слово (очень примерно), время напрямую зависит от количества запрашиваемых
слов. Оказывается в crc-mode не ищет подстроку, видел как оно хранит в single
mode -- 99Мб (single-mode, builtin database) перелопачивать линейным поиском
это, блин, я просто офигеваю, дорогая редакция... по минуте ищет... 100%цпу
загрузки... Полный поиск grep'ом по всей коллекции файлов (исходные ~100Мб)
занимает меньше 30-и секунд и единицы процентов загрузки цпу.

Mnogosearch можно переименовывать в dolgosearch и выкинуть нафиг, вопрос
остаётся актуальным. Смотрел внутрь 'mg




Темы: Игры, Программное обеспечение, Пресса, Аппаратное обеспечение, Сеть, Демосцена, Люди, Программирование

Похожие статьи:
Мillennium Reрort - 5.6 мaя,в Минскe, в клубe "Тoннeль" прoшeл втoрoй фeстивaль кoмпьютeрнoгo исскуствa "Мillennium 1901".
How it was in Leningrad - Year 1992-1993. Meeting Amiga
Юмор - анекдоты.
WANTED - Розыск программ.
ZIP - приложение к газете.

В этот день...   24 апреля