suchmaschinen


Suchfibel / Geschichten um das Suchen / Morgen ... / Bessere Suchtechnik

Bessere Suchtechnik

Die Zahl der indexierten Dokumente im Internet hat die Milliardengrenze überschritten. Die Datenmengen werden so groß, dass selbst Hochleistungsrechner nicht mehr mithalten können. Daher wird die Rechenleistung und Lagerkapazität zunehmend auf viele kleinere Rechner verlagert. Google hat 3.000 Rechner zu einem Netzwerk zusammengesteckt, Fast arbeitet ebenfalls mit einer Serverfarm von Rechnern, die zu einem Cluster verbunden sind. Enormer Vorteil: Man kann stapelweise vergleichsweise preiswerte Standardrechner benutzen, die leicht zu ersetzen sind. Und: je nach Anforderung lässt sich die Leistung durch Anstöpseln zusätzlicher Rechner erweitern. Nur durch dieses Clustering kann eine Volltextsuchmaschine auch in Zukunft in Sachen Datenbestand mithalten.

Zusätzlich zur technischen Verbesserung der Indexerstellung müssen die Verfahren zum Ranking wachsen. Das ist ein recht problematisches Feld, denn der Ersteller einer wissenschaftlichen Arbeit ist zwar daran interessiert, seine Arbeit angemessen bei entsprechenden Suchanfragen gelistet zu sehen, der kommerzielle Werbetreibende will auf alle Fälle der Allererste sein und wird sich entsprechender unfeiner Methoden bedienen, wie sie jetzt schon als Spamdexing bekannt werden.

Einer solchen Entwicklung kann zwar auch mit technischen Mitteln begegnet werden, diese wird aber mit weiteren Tricks seitens der Spammer beantwortet werden. Schon dreht sich das Karussell. Konsequenter ist eine klare Trennung zwischen wissenschaftlicher Information und Werbung. Die schwierige Aufgabe einer Grenzziehung wird wohl teilweise durch die Hochschulen übernommen werden (müssen); unterstützt durch die bereits angesprochenen Metainformationen.

Seitenanfang



Kontext:

 Fireball


 Spamdexing


 Google


 Alltheweb






Impressum | Hilfe | Buchbestellung



Created by 23.10.2009 ID: 173 SORT: 720 PAPA: 171
Suchfibel Home