ZXNet эхоконференция «zxnet.pc»


тема: indexing and search tool



от: Kirill Frolov
кому: All
дата: 07 Jan 2003
Hемедленно нажми на RESET, All!

06 Jan 03 22:52, Kirill Frolov wrote to All:

KF> вопрос остаётся актуальным. Смотрел внутрь 'mg

от: Kirill Frolov
кому: All
дата: 07 Jan 2003
Hемедленно нажми на RESET, All!

05 Jan 03 13:57, Kirill Frolov wrote to All:

KF> Хочу проиндексировать свои файлы (текстовые) для быстрого поиска.
KF> Мне не нужен Web-поисковик! Попробовал 'mg'. Тоже не работает с
KF> русскими буквами. Прямо-таки анти-русский заговор какой-то,

KF> Может можно как-нибудь mnogosearch приспособить?

Hельзя. Контекст не показывает -- это самое плохое.
Hаходит много, всё лишнее, толку мало. Человеческого интерфейса (как у grep)
нет.
Hа ~100Mb входных данных (из них ещё минимум четверть не индексируется) строит
60Мб индексов (crc-multi, builtin database). Среднее время поиска 5-10 секунд
на слово (очень примерно), время напрямую зависит от количества запрашиваемых
слов. Оказывается в crc-mode не ищет подстроку, видел как оно хранит в single
mode -- 99Мб (single-mode, builtin database) перелопачивать линейным поиском
это, блин, я просто офигеваю, дорогая редакция... по минуте ищет... 100%цпу
загрузки... Полный поиск grep'ом по всей коллекции файлов (исходные ~100Мб)
занимает меньше 30-и секунд и единицы процентов загрузки цпу.

Mnogosearch можно переименовывать в dolgosearch и выкинуть нафиг, вопрос
остаётся актуальным. Смотрел внутрь 'mg




Темы: Игры, Программное обеспечение, Пресса, Аппаратное обеспечение, Сеть, Демосцена, Люди, Программирование

Похожие статьи:
Игры - Плюсы и минусы игры "Операция Р.Р."
Каникулы в Калифорнии - Она остановилась со вздымающейся грудью, чтобы перевести дыхание...
Накануне - Не боги, но люди.
Система - Обзор ассемблеров: ZEUS , TASM , PRIMUS , GENS4 , GEMUS.
Ужас - Очeнь страшныe истoрии с дoлeй чeрнoro, нo oчeнь улeтнoro юмoра.

В этот день...   1 июля