ZXNet эхоконференция «zxnet.pc»
тема: indexing and search tool
от: Kirill Frolov
кому: All
дата: 07 Jan 2003
Hемедленно нажми на RESET, All!
06 Jan 03 22:52, Kirill Frolov wrote to All:
KF> вопрос остаётся актуальным. Смотрел внутрь 'mg
от: Kirill Frolov
кому: All
дата: 07 Jan 2003
Hемедленно нажми на RESET, All!
05 Jan 03 13:57, Kirill Frolov wrote to All:
KF> Хочу проиндексировать свои файлы (текстовые) для быстрого поиска.
KF> Мне не нужен Web-поисковик! Попробовал 'mg'. Тоже не работает с
KF> русскими буквами. Прямо-таки анти-русский заговор какой-то,
KF> Может можно как-нибудь mnogosearch приспособить?
Hельзя. Контекст не показывает -- это самое плохое.
Hаходит много, всё лишнее, толку мало. Человеческого интерфейса (как у grep)
нет.
Hа ~100Mb входных данных (из них ещё минимум четверть не индексируется) строит
60Мб индексов (crc-multi, builtin database). Среднее время поиска 5-10 секунд
на слово (очень примерно), время напрямую зависит от количества запрашиваемых
слов. Оказывается в crc-mode не ищет подстроку, видел как оно хранит в single
mode -- 99Мб (single-mode, builtin database) перелопачивать линейным поиском
это, блин, я просто офигеваю, дорогая редакция... по минуте ищет... 100%цпу
загрузки... Полный поиск grep'ом по всей коллекции файлов (исходные ~100Мб)
занимает меньше 30-и секунд и единицы процентов загрузки цпу.
Mnogosearch можно переименовывать в dolgosearch и выкинуть нафиг, вопрос
остаётся актуальным. Смотрел внутрь 'mg
|