suchmaschinen


Suchfibel / Suchmaschinen Software / Serversoftware / Freie Software

Freie Software

 Matt Wrights Script Archive ist eine der bekanntesten Adressen im Netz, wenn es um freie Perl-Scripts geht. Matts Suchmaschine erfordert einige Programmierkenntnisse bei der Installation und durchsucht HTML-Seiten im Filesystem bestimmter Serververzeichnisse im Volltext. Die Konfiguration erfordert mehr als nur oberflächliche Kenntnisse in Perl. Das Script ist recht flott und geeignet für kleine bis mittlere Sites.

 Gamelan ist wie schon erwähnt die Quelle für Java-basierte Suchmaschinen.

 Excite for Web Servers ist ein ca. 2MB großes Paket für die gebräuchlichsten Serverbetriebssysteme. Leicht zu installieren erlaubt die Software Volltext- und Konzeptsuche, bei der automatisch Zusammenfassungen der Seiten erstellt werden.

 freeWAIS-sf ist eine populäre Software für die meisten Unix-Betriebssysteme. Die Software erlaubt die Verknüpfung von Suchbegriffen mit Boole´schen Operatoren. Es existieren verschiedene Newsgroups, wo man sich über Installation, Konfiguration und Weiterentwicklung informieren kann.

 GlimpseHTTP läuft auf etlichen Hundert Servern weltweit. Der generierte Index hat lediglich 3 - 5% der Größe der indexierten Dokumente. Die Software ist (nur) für nichtkommerziellen Einsatz frei erhältlich. Wie viele der frei erhältlichen Suchsoftwares wurde Glimpse an einer amerikanischen Hochschule entwickelt, an der Universität von Arizona.

 Webglimpse ist eine erweiterte Version von Glimpse. Mit Webglimpse ist es möglich auch Dokumente außerhalb des eigenen Servers dem Index zuzufügen.

 SWISH (Simple Web Indexing System for Humans) ist eine verbreitete Software für Unix, die in der Lage ist, einen sehr kleinen Index zu erstellen.

 SWISH-E (SWISH Enhanced) ist die verbesserte Version. Die Suche kann auf einzelne Seitenelemente wie Überschriften und Meta-Tags beschränkt werden. Auch stehen Boole´sche Operatoren und Wildcards zur Verfügung.

 Thunderstone Webinator ist für so gut wie alle ernst zu nehmenden Serverbetriebssysteme zu haben. Die Freeware-Version ist auf 10.000 Seiten beschränkt, die kommerzielle Version kann unbegrenzt viele Webseiten indexieren. Der Robot kann auch externe Seiten erfassen. Die Konfigurationsmöglichkeiten sind umfassend; Boole´sche Verknüpfungen sind ebenso möglich wie Fuzzy-Suche und Sortierung der Treffer nach Relevanz.

 Harvest wurde an der Universität von Colorado entwickelt und ist eines der ersten Robotersysteme.

htdig  ht://DIG ht://Dig kann im Unterschied zu anderen Suchsoftwares Websites auf verschiedenen Servern durchsuchen. Das Programm ist für kleinere Domains oder Intranets gedacht, erlaubt auch die Suche im Filesystem und in PDF Dateien. Die Meta-Tags description und robots werden unterstützt. Die Software wurde an der San Diego State University entwickelt und wird unter der  GNU General Public License verbreitet. XXX hat ht://dig mit Netscapes Webcompass Server verglichen.

Seitenanfang





Impressum | Hilfe | Buchbestellung



Created by 23.10.2009 ID: 161 SORT: 510 PAPA: 160
Suchfibel Home