Alles zu Suchmaschinen: Suchfibel Startseite


suchmaschinen


Suchfibel / Suchmaschinen Leistungs-Check !:

Suchmaschinen Leistungs-Check !:

Aktualität der Datenbasis von Suchmaschinen.

Business Interactive (Info Seitenende) untersucht monatlich die Leistungen der Datenbanken und Spider der großen internationalen und deutschen Suchmaschinen.

Spezielle Robots richten automatische Anfragen an die wichtigsten internationalen und deutschen Suchmaschinen und werten die Ergebnisseiten aus.

Das Verfahren:

Bei deutschsprachigen Suchmaschinen werden nach Zufallsauswahl Substantive aus einer deutschen Wortliste abgefragt. Bei englischsprachigen Suchmaschinen kommt eine englische Liste zum Einsatz. Wörter, die bei allen geprüften Suchmaschinen nicht mindestens zehn Suchtreffer und damit auswertbare URLs erzielen, werden aus der Wortliste gestrichen und zukünftig nicht mehr eingesetzt. Jede Suchmaschine erhält etliche hundert Suchanfragen. Sobald eine Datenbasis von etwa 2,200 bis 2,500 URLs von einer Suchmaschine vorliegt, wird der Vorgang abgebrochen.

Die Antwortseiten werden umgehend ausgewertet und die gefundenen URLs der Suchtreffer auf Korrektheit überprüft.

Was sagen die Daten?

Diese Zahlen spiegeln die tatsächliche Verfügbarkeit der gefundenen Suchtreffer und sind damit ein Wert für die Korrektheit und Aktualität des Index. Fehlerhafte Seiten werden nämlich automatisch von den Suchmaschinen entfernt. Suchtreffer, die auf nicht mehr existierende Seiten verweisen, wurden durch die suchmaschineninternen Robots noch nicht erkannt. Je kürzer die Zeitdifferenz zwischen der Änderung oder Löschung einer Webseite und der Aktualisierung des Index, desto weniger unbrauchbare Suchtreffer wird die Maschine liefern.

Diese Zahlen besagen nichts über die inhaltliche Korrektheit der Suchtreffer und die Relevanz bezüglich der Suchanfrage. Es wird ausschließlich die technische Verfügbarkeit der indexierten Dokumente gemessen.

Die auf 39543 Seiten basierende Auswertung:

Suchmaschine urls ok 200 A B C D 301 302 400 403 404 500
Eule 2072 97.73 97.59 0.77 1.01 0.05 0.05 0.10 0.05 0.34 0.05
Crawler DE 2231 96.41 96.41 2.24 0.31 0.04 0.09 0.04 0.85
Swiss Search 2011 96.37 96.37 0.75 0.35 0.20 1.84 0.50
Excite 2490 96.22 96.06 1.00 0.68 0.28 0.60 0.16 0.24 0.96
AOL Netfind 2479 96.25 96.05 1.09 0.69 0.44 0.52 0.20 0.04 0.12 0.85
the blue window 1979 94.85 94.74 1.87 0.61 0.20 0.51 0.05 0.05 0.10 1.87
WebCrawler 2276 95.34 93.80 1.41 0.70 0.75 0.48 0.18 1.36 0.35 0.97
Nathan 1680 93.10 92.74 0.89 0.65 0.06 0.42 0.06 0.30 0.06 4.82
Euroseek 2456 92.96 92.71 1.59 0.77 0.49 0.81 0.24 3.30 0.08
Fireball 2394 92.73 92.27 1.09 0.63 2.26 0.29 0.25 0.21 2.97 0.04
Intersearch DE 2183 92.95 92.08 1.10 1.51 0.18 0.23 0.18 0.69 0.23 3.16 0.64
AltaVista 2450 91.80 90.00 0.82 1.18 0.53 1.31 0.24 1.55 0.37 3.96 0.04
Infoseek 2517 92.21 89.07 1.15 0.95 0.68 0.28 0.36 2.78 0.16 4.45 0.12
Aladin 1910 93.40 88.43 1.52 1.26 0.26 0.99 2.09 2.88 0.21 2.36
Euroferret 2323 87.73 86.96 2.20 3.19 0.90 0.47 0.17 0.60 0.13 5.38
AustroNaut 2392 88.75 86.58 1.09 1.59 0.59 0.84 0.54 1.63 0.21 6.90 0.04
Planet Search 2522 87.47 84.85 0.83 2.93 0.75 0.83 0.20 2.42 0.52 6.66
Intersearch AT 2007 89.99 84.06 0.55 0.75 0.50 0.50 1.00 4.93 7.72
Lycos DE 2235 81.57 77.99 0.40 1.88 0.31 1.07 0.63 2.95 0.45 13.33 0.98
Northern Light 2260 80.53 77.83 1.15 1.59 1.19 3.81 0.40 2.30 0.40 10.93 0.40
Lycos UK 2524 78.33 74.68 1.15 2.26 0.36 1.82 0.83 2.81 1.27 14.38 0.44
Swiss Web 688 68.02 63.08 0.29 1.60 0.15 2.33 1.60 3.34 1.16 26.45
HotBot ausgegebene Seiten enthalten zu viele Fehler
Lotse ausgegebene Seiten enthalten zu viele Fehler

Anmerkungen:
urls: Zahl der bearbeiteten URLs
ok: Prozentanteil der Seiten, die unter der gemeldeten Adresse oder durch Verfolgung eines Redirects gefunden wurden
200: Prozentanteil der Seiten, die unter der gemeldeten Adresse gefunden wurden
A: Abrufe, bei denen nach 2 Minuten aufgegeben wurde, in Prozent.
B: Web Server [Maschine] nicht betriebsbereit [in Prozent]
C: Web Server [Software] nicht erreichbar [in Prozent]
D: Hostname unbekannt [in Prozent]
301: Seite befindet sich dauerhaft unter neuer Adresse [in Prozent]
302: Seite befindet sich vorübergehend unter neuer Adresse [in Prozent]
400: Server meint, eine nicht zu befriedigende Anfrage erhalten zu haben [in Prozent]
403: Zugriff nicht erlaubt [in Prozent]
404: Seite existiert nicht [in Prozent]
500: Server Error [in Prozent]

Die wichtigsten Spalten der Vergleichstabelle sind 200, 404 und ok. Sonstige 400er Fehlermeldungen entstehen durch geänderte Zugriffsrechte auf einem Server; 500er hauptsächlich, weil manche Suchmaschinen inzwischen auch URLs aufnehmen, die durch ein CGI-Programm beantwortet werden. Änderungen der CGI-Programme oder nicht ganz korrekte Parameter resultieren in einem Server-Error.

Der Robot, der die Suchmaschinen-Abfragen automatisiert, hört auf den Namen sequery. Tests liefen auf red.kso.co.uk.

business interactive Auf den Informationsseiten von Klaus Schallhorn können Sie grundlegendes als auch spezielles Wissen zur Realisation einer professionellen Web Präsenz erwerben. Sie finden dort gründlich recherchiertes Know How und Online Tools zur Überwachung und Optimierung Ihrer Onlinepräsenz. Klaus Schallhorn ist Spezialist für die Konzeption und Realisierung interaktiver Websites: http://www.kso.co.uk/

Seitenanfang





Benutzerdefinierte Suche

Impressum | Hilfe | Buchbestellung



Created by 24.02.2009 ID: 216 SORT: 500 PAPA: 1
Suchfibel Home