ASPseek

Софтуер снимки:
ASPseek
Софтуер детайли:
Версия: 1.2.10
Дата на качване: 3 Jun 15
Розробник: SWsoft
Разрешително: Безплатно
Популярност: 4

Rating: nan/5 (Total Votes: 0)

ASPseek е софтуер интернет търсачка, разработена от SWsoft и се лицензира като свободен софтуер под GNU GPL.
ASPseek състои от индексиране робот, демон търсене и интерфейса търсене CGI. Тя може да индексира колкото няколко милиона URL адреси и търсене на думи и фрази, използване на заместващи символи, и да направя Булева търсене. Резултати от търсенето може да се ограничи до период от време предвид, сайт или уеб пространство (набор от сайтове) и подредени по уместност (PageRank се използва) или дата.
ASPseek е оптимизиран за множество сайтове (резба индекс, асинхронен DNS заявки, групиране на резултатите от сайт, уеб пространства), но може да се използва за търсене на един сайт, както добре. ASPseek може да работи с множество езици / кодировки наведнъж (включително многобайтовите кодировки като китайски) поради Unicode режим на съхранение. Други характеристики включват stopwords и ispell подкрепа, а набор от знаци и език guesser, HTML шаблони за резултатите от търсенето, откъси, и думи, подчертаващи.
ASPseek е написан на C ++, използвайки STL библиотеката, и използва смесица от SQL база данни и бинарни файлове за съхранение.
Ето някои основни характеристики на "ASPseek":
Възможност за индексиране и търсене чрез няколко милиони документи
 
· Използване ASPseek, може да се изгради база данни и търсене чрез много сайтове и резултати за всяка заявка, ще бъдат върнати бързо, дори ако имате няколко милиони документи индексирани. Разбира се, това зависи от хардуера, така че не очаквайте "добрата стара" i486 машина, за да се справят с всеки сайт в .com домейн. Всичко зависи от CPU (и), памет, диск скорост и т.н. Така че вашите собствени тестове преди да купите специализиран хардуер.
 
• Фактът, че ASPseek е оптимизирана за големи обеми не трябва да ви спре да го използвате, за да намерите вашия собствен сайт, който съдържа няколко стотин на документи - тя работи там.
 
Много добра приложимост на резултатите
 
· Целта на търсачката е да намерите това, което потребителят иска. Не може да има хиляди URL адреси са намерени в резултат на заявка за търсене, но всичко това може да бъде от значение, така че потребителя ще бъде недоволен.
 
· Изходни резултати в ASPseek са сортирани по значимост (или ранг), но Изчисляване ранг не е лесна задача. Разработчиците се опитали всичко възможно да включи най-големите и най-новите техники в ASPseek двигателя при запазване добра скорост търсене.
 
Подкрепа Ispell
 
· Когато ASPseek се използва с ispell подкрепа, searchd (1) може евентуално да намерите всички форми за всички посочени думи (например: създаване -> Създаване или създадени или създава). Така че, тя ви позволява да намерите думата във всички различни форми.
 
Режим на съхранение Unicode
 
· ASPseek може да съхранява информация за документи в Unicode, като по този начин е възможно да се приложи многоезична търсачка. Така че, вие може да индексира и търсене на документи на английски, руски и дори китайски, всички в една база данни.
 
HTTP, HTTPS, HTTP прокси, FTP (чрез пълномощник) протоколи
 
· Както ASPseek е уеб търсачката, тя използва HTTP протокол към индексни сайтове. ASPseek също подкрепя сигурни HTTPS: // протокол. FTP протокол не се поддържа директно, но можете да използвате прокси (като калмари) и индекс на FTP сайтове чрез пълномощник.
 
· ASPseek подкрепя "основния разрешение" характеристика на HTTP, така че може да индексира защитени с парола области (например лична информация във вашия интранет).
 
Текст / HTML и текст / обикновена видове документи подкрепа
 
· ASPseek може да разбере документите HTML и текстови документи. Това са най-популярните формати в Интернет.
 
· Други формати, като например PDF, RTF, и т.н., могат да бъдат подкрепени с помощта на някоя външна програма / скрипт, който е в състояние да конвертирате, че формати за HTML или обикновен текст.
 
Многонишков дизайн, асинхронен DNS Резолвер т.н.
 
· ASPseek използва POSIX теми, това означава, че един процес има много теми, работещи в паралел. Така индексни сваляния документи от много сайтове, както и търсене на Daemon процеси много заявки за търсене едновременно. Това не само помага ASPseek да мащабирате и върху системите за SMP (многопроцесорни), но също така подобрява скоростта индексиране, защото в случай на една нишка ще бъдат изразходвани най-много време за изчакване за данни от мрежата.
 
· Едно нещо, което бавен процес индексиране надолу много е DNS справка (процес на определяне на IP адрес, използвайки името на сървъра). За да се избегнат забавяния, асинхронни заявки (за справка се извършва чрез отделни специализирани процеси) и IP адреса на кеша се изпълняват.
 
Stopwords
 
· Stopwords са на думи, които нямат смисъл, само по себе си. Примери: е, сме, при това. Търсене в е безполезна, така тези думи са изключени от заявката за търсене. Stopwords също са изключени от база данни по време на индексиране, така база данни става по-малък и по-бързо.
 
· Няма "вграден" stopwords в ASPseek, те са натоварени при зареждане на системата от файлове. Много stopword файлове за различни езици идва с ASPseek.
 
Кодова guesse
 
· Някои счупени или зле конфигурирани сървъри не казва на клиентите набора от знаци, в които те предоставят съдържание. Ако индексиране такива сървъри, или като се използват ASPseek за индексиране на FTP сървъри (FTP протокол не знае нищо за набори от знаци), набор от знаци guesser може да се използва, за да се справят с него. Кодова guesser използва честота на думите маси (наречени langmaps) за определяне на правилния набор от знаци.
 
Стандартна изолация Robot (robots.txt) подкрепа
 
· ASPseek напълно подкрепя този стандарт. Той е предназначен за автори на уеб сайт за разказване на робота (например индекс ASPseek (1)), за да пропуснете индексиране някои директории на техните сайтове.
 
· За повече информация вижте http://www.robotstxt.org/wc/robots.html
 
Настройки за контрол на използването на мрежови трафик и уеб сървъри натоварване
 
· Можете да управлявате прецизно мрежови трафик, че индекс (1) използва. Точно така, можете да ограничите честотната лента (изразена в байтове в секунда), използван от индекса (1) за определен период от време на деня. Например, можете да ограничите честотната лента в работно време, така че хората в офиса ви, няма да изпитат бавна интернет.
 
· Можете също да зададете минималното време между две запитвания към същия Web сървър, така че няма да бъде претоварен и слезе на колене, докато ви свършат индекс (1).
 
В реално време асинхронен индексиране
 
· Някои търсачки изисква търсене трябва да бъде спряно за времето на обновяване на базата данни. ASPseek няма нужда от нея, така че можете да търсите нон-стоп.
 
· Повече да кажа, има специален режим на индексиране нарича "реално време", индексиране. Можете да го използвате за малък брой документи, и доколкото е такъв документ е изтеглен и преработен, промените са непосредствено видими в търсене интерфейс. Тази функция е от голяма полза, ако сте изграждане на уеб сайтове за страници с бързо променящия съдържание, като например онлайн новини и т.н.
 
· Имайте предвид, че редица документи в "реално време" на база данни е ограничен. Това е около 1000 на нашия хардуер (пробег може да варира), и колкото повече документи, които имате в база данни "в реално време", толкова по-бавно ще бъде скоростта на индексиране в това (и само това) база данни. Това няма да повлияе на скоростта търсене все пак.
 
· Документи от база данни "в реално време", се преместват в нормална база данни след пускането на индекса (1) в нормален начин.
 
Подреждане резултатите по значение или по дата
 
· Търсачките обикновено се връща първата най-важните резултати. Но ако търсите най-нови страници, можете да кажете ASPseek да подреди резултатите от последната дата модификация, така наскоро променени (или създадена) страници ще бъде показан на първо място.
 
Откъси, думи за търсене, подчертаващи
· Откъс е парче намерен документ с думи търсихте подчерта, само за да даде представа за това, което документът е около. Можете да персонализирате броя откъси показване и тяхната дължина. Ако ще забрани откъси, ще се появи в началото на документа.
 
· Всеки намерен документ е придружен с "Кеширана" връзката. ASPseek поддържа местен сгъстен копие от всеки документ, обработен, така употреба на целия документ с (не е задължително) да разгледате подчертани думи, които са търсили, дори ако тя е била отстранена от оригиналния сайт (което се случва понякога).
 
Групирането на резултатите по сайт
 
· Резултати от един сайт могат да бъдат групирани заедно. Ако групиране по обекти е на само две резултати се извеждат от същото място, по подразбиране, и потребителят може да видите други страници от същия сайт, като следвате "Още резултати от ..." връзка.
 
Клонове
 
· Клонингите са идентични документи на различни места. Те се откриват и групирани заедно, така че потребителя няма да бъде представена страница пълна с URL адреси към идентични документи.
 
· Откриване Clone обикновено е ограничен от един сайт (така еднакви документи от различни сайтове, които не са отчетени като клонинги), но можете да промените това, като прекомпилирате ASPseek с --disable-клонинги-по-сайт опция.
 
Spaces и подгрупи
 
· Space е набор от сайтове. Така че, ако искате да се осигури търсенето стеснен до някаква област, можете да създадете пространство и търсите в това пространство. Само цели сайтове (напр http://www.mysite.com/) могат да бъдат включени в пространството.
 
· Подгрупи могат да бъдат използвани за ограничаване на търсенето. Можете да създадете подгрупа и сложи URL маска (като http://www.mysite.com/mydir/%) в това, и след това да ограничи обхвата търсене само дадена подгрупа.
 
· Можете да ограничите обхвата търсене, за да не само една, а няколко подгрупи или пространства.
 
HTML шаблони за лесни за персонализиране резултати от търсенето
 
· Можете да персонализирате вашите страници за търсене, така че те ще изглеждат и да се интегрират безпроблемно с останалата част от вашия сайт. Това се прави чрез просто редактиране на шаблон за търсене на файлове.
Монтаж
GZIP-DC aspseek-1.2.10.tar.gz | катран XF -
CD aspseek-1.2.10. / конфигурирате
правя
SU
правят инсталирате

Друг софтуер на разработчика SWsoft

OpenVZ Live CD
OpenVZ Live CD

2 Jun 15

Plesk for Windows
Plesk for Windows

22 Sep 15

OpenVZ kernel
OpenVZ kernel

2 Jun 15

Коментари към ASPseek

Коментари не е намерена
добавите коментар
Включете на изображения!