Предложите решение? (поиск по сайту)

Majik13

Старожил
Хм. Я не программист, но вроде существуют два типа поисковиков:

1й предварительно создает индекс сайта, пишет все это в базу, регулярно (кроном) обновляет индекс, и по запросу вытягивает из своей базы нужную информацию. По крайней мере наш TrueSearch сделан по такому принципу ;)
2й начинает бегать по страницам после запроса и выдает подходящие варианты.

С таким сайтом, как ты описал - лучше, мне кажется 1й вариант, просто прикрути к нему поиск (правда почти наверняка скрипт поиска без MySQl или другой БД не обойдется). В чем тут минус - в том, что индекс сам по себе будет весить чуть меньше чем сайт ;)

Второй вариант будет слишком долго работать.
 

Majik13

Старожил
Если ты ищешь конкретный программный продукт, то так и надо было писать.

Что касается TrueSearch, то я не могу сказать, раздается он или нет.
Есть два варианта - бесплатно, но когда - фиг знает (когда не лень будет письмо написать), и без сопровождения, ну и -НЕбесплатно, с заточкой под конкретный сайт. Что он реально умеет делать - хороший вопрос ;) Релевантный он точно. Анализа морфологии точно нет.
Второй вариант предусматривает предварительные комментарии со стороны нашего программиста о возможностях поиска ;)

На http://www.region47.ru он установлен и работает.

Короче ищи в сети. Я не знаю, что лучше. Мы например делали поиск по своим понятиям, то есть PHP + MySQL, релевантность и работа с русскими текстами. Заграничные поиски не все так умеют. Но наверняка есть более сложные и точные системы.
 

Hooch

Старожил
Ты случаем не MnogoSearch выбрал?
Не связывайся с этой байдой =).
Такие индексные поисковики как RiSearch(бесплатный) уступают по функциональности нашему продукту. Правда наш платный. У нашего один недостаток - отсутствие учета морфологии слов.

Тебе нужен поиск с:
1. Релевантным поиском.
2. Морфологией.
3. Высокой скоростью работы и индексирования.

P.S. Если пофиг на имидж, то очень рекомендую взять яндексовскую форму(бесплатную) и поставить на свой сайт. Там есть опция ("искать на этом сайте"), при желании можно прикрутить ссылку на нее к какой-нибудь другой форме ввода. С яндексовским поисковым движком по всем параметрам ничего не сравнится.
 

Hooch

Старожил
Прохожий":34qeuc5f сказал(а):
С Яндексом идея не канает - поисковик должен работать даже без доступа в инет, так что увы.

Сайт локальный что-ли? Чего за сайт-то здоровый такой? Если глобальный, то без доступа в инет сам работать не будет ;).
 

Majik13

Старожил
Я тут вспомнил историю, когда ошибся в скрипте на Perl и он отжучил мне за доли секунды несколько десятков мегабайт из разных файлов в один. Это при том, что у меня тогда еще стоял очень дохлый компьютер. Я к тому, что считается, что Perl быстрее чем PHP работает с большими объемами текста, кроме того, сейчас к перлу нормально БД прикручивают. Может тебе стоит рассмотреть вариант скрипта на перл, если уж объемы текста такие большие? Точно знаю, что такие скрипты бывают.
P.S. А ты случаем не в библиотеке работаешь?
:lol:
 

Majik13

Старожил
А я и не говорил, что он просто склеил. Там и примитеивный парсер был в скрипте, и такая же примитивная работа с файловой системой ;) Просто перл, даже по названию practical extraction & report language (если не ошибаюсь) в нем очень хорошо организована работа по обработке именно текста, шаблоны (маски), регулярные переменные... У меня есть подозрение, что на unix системах mod_perl будет работать быстрее чем php. Просто большинство спайдеров, которые ищут в реальном времени, точно на перл сделаны. Ну короче это мое личное мнение.
А кстати, что тебе мешает установить несколько вариантов поиска один за другим и посмотреть который лучше (банально время засечь индексации, оценить вывод результатов). Сайт-то твой они не порушат, а так найдешь оптимум именно для твоих целей.
 

gram

Старожил
вроде у яндекса бесплатны движок был для поиска на своём сайте.. По крайней мере у меня валяется где-то. Я, правда, не разбирался с прикручиванием и не смотрел (т.к. там четко было написано, что ищет он только на своём сервере, а в то время искались альтернативы софтовому поисковику)
 

gram

Старожил
ааа, ну хз.. может там и для других было... не помню :)
 

Hooch

Старожил
Это оптимизаторский форум - для тех, кто занимается раскруткой сайтов. Одно время я там зависал. Про локальные движки там врядли чего есть.
 
Верх