Search before you surf!"Search before you surf!". Das ist das Motto der Suchmaschine WebCrawler - und dieses Motto sollte eigentlich für jeden professionellen World-Wide-Web-Surfer gelten. Dies hat zwei ganz einfache Gründe: 1. Das Netz wird weniger belastet und 2. weniger wertvolle eigene Zeit wird sinnlos verplempert.
|
|
Doch wie läßt sich die Informationssuche (auf webdeutsch: surfen) im
World Wide Web effektiv gestalten. Nun, ich bin nicht der erste, der diese
Frage stellt und deshalb gibt es neben Server-Listen, wie z.B. die Liste
der deutschen WWW-Server (URL:
http://www.chemie.fu-berlin.de/outerspace/www-german.html), Indizes
(Verzeichnisse), bei denen die Links
thematisch sortiert und in Kategorien eingeordnet sind (z.B. Yahoo oder
Web.de), und die sog. Suchmaschinen (z.B. Lycos oder Excite).
Während die Handhabung der Verzeichnisse selbst der WWW-Neuling sofort versteht (man klickt sich durch immer feiner werdende Kategorien an sein Ziel), erfordert die effektive Nutzung einer Suchmaschine etwas mehr an Wissen und Erfahrung. Somit haben beide Formen ihre Vor- und Nachteile: Verzeichnisse á la Yahoo oder Web.de lassen sich sehr leicht bedienen, decken aber nur eine sehr kleinen Teil des WWW ab (weniger als 2%). Dagegen decken die Suchmaschinen große Teile des Web ab (bis 90%), sind aber komplizierter zu bedienen. Dieser Artikel stellt zunächst ein paar Verzeichnisse und Suchmaschinen vor und gibt dann eine Einführung in die erweiterten Abfragemöglichkeiten der Suchmaschinen. Beendet wird dieser Artikel mit einem Überblick über die ausgefallenen Suchoperatoren von Alta Vista, mit denen man nicht nur nach Text suchen kann. Eins soll noch erwähnt werden: Alle Verzeichnisse bieten inzwischen auch die Möglichkeit, Suchanfragen - beschränkt auf ihren Datenbestand - zu stellen und immer mehr Suchmaschinen bieten ihrerseits wiederum Verzeichnisse an. Verzeichnisse:
Suchmaschinen:
|
URL = Uniform Resource Locator; bezeichnet die eindeutige Adresse eines Dokuments im WWW. |
Sonstige Datenschnüffler:Das Internet besteht nicht nur aus dem World Wide Web. Schon vorher gab es Informationsdienste wie das Usenet oder Gopher. Aber dank des WWW lassen sich auch diese Dienste komfortabel durchsuchen:
|
Ein
Spider (auch Crawler oder Robot genannt) ist ein Programm, das
automatisch durch Web-Seiten surft, die Links einer Seite extrahiert und
dann diese Seiten aufruft. Jede Suchmaschine hat so einen Spider laufen,
um Daten über Web-Seiten zu sammeln.
Auf einem WWW-Server kann der Administrator eine Datei anlegen, die Spidern untersagt, Seiten dieses Servers abzusuchen, da diese Programme eine erhebliche Belastung des Servers bedeuten und ein Otto-Normal-User mit seinem WWW-Browser dann möglicherweise leer ausgeht. Leider unterstützen nicht alle Spider das Robot-Exclusion-Protokoll. |
Dies ist natürlich nur eine kleine Auswahl. Unter der Adresse
http://www.acsu.buffalo.edu/~tate/search-all.html
hat Tim Tate
eine Übersicht von mehr als 70 Suchmaschinen im WWW
zusammengestellt. Alle in diesem Artikel erw&aauml;hnten Adressen (und noch ein paar mehr) findet ihr hier. Tips und Tricks für eine effektive SucheDie meisten der oben erwähnten Suchmaschinen verfügen über zwei Anfragemodi: Einer einfachen Suchanfrage, bei der meist nur ein Stichwort angegeben werden können, und einer erweiterten Abfragemöglichkeit, bei der die Suchbegriffe mittels logischer Operatoren verknüpft werden können. Und genau diese sollte man verwenden, wenn man nicht hunderte von nicht-gewollten Dokumenten angezeigt bekommen möchte. Ein Beispiel soll dies verdeutlichen: |
Wegen der schlechten Farbwahl und der langen Ladezeit habe ich die Seite etwas angepaßt und gespiegelt. |
Gesucht wird unsere Fachschaftszeitschrift, die bits. Eine Anfrage bei Lycos mit dem Stichwort bits liefert sage und schreibe 40.073 Antworten. Bei dieser Zahl wird wohl keiner darauf kommen, die Antwortseiten durchzublättern.Dieses kleine Beispiel zeigt, wie sinnvoll die Verwendung logischer Operatoren ist. Fast jede Suchmaschine kennt mindestens die Operatoren AND und OR. Weniger häufig ist das NOT anzutreffen, daß meiner Meinung nach aber in keiner Suchmaschine fehlen sollte. Die wenigsten Suchmaschinen verfügen schließlich noch über den Operator NEAR. Eine Anfrage wie bits NEAR Zeitschrift bedeutet dann, daß der Suchbegriff bits in der Nähe von Zeitschrift auftauchen muß. Was mit ,,Nähe`` gemeint ist, kann oft noch spezifiziert werden, z.B. im Abstand von 12 Wörtern. Ein Sonderfall des NEAR ist die direkte Folge von Suchbegriffen, z.B. bei Namen wie ,,Albert Einstein`` oder bei Titeln. Dieses kann bei den meisten Maschinen durch den Einschluß in Gänsefüßchen ('') erreicht werden. Bevor man also eine Suchanfrage stellt, sollte man sich soviele Suchbegriffe wie möglich ausdenken, die im gesuchten Dokument vorkommen können. Wenn das Ergebnis dann unbefriedigend ist, läßt sich durch Wegnehmen oder Umformulieren von Suchbegriffen immer noch mehr erreichen, als wenn nur ein Begriff angegeben wird. Außerdem ist NEAR (wenn vorhanden) dem AND vorzuziehen, denn meistens stehen die gesuchten Begriffe eng beieinander. Wenn die Möglichkeit besteht, sich bei der Suche auf unterschiedliche Bestandteile eines Dokuments beziehen zu können, dann sollte dies unbedingt genutzt werden. Die Beschränkung der Suche auf Titel oder die Einschränkung der URL (bzw. des Landes oder auch der Sprache) liefert viel früher gute Ergebnisse. Der folgende Abschnitt beschreibt die Suchoperatoren von Alta Vista, mit denen sich genau dieses erreichen läßt. Suchanfragen mit Alta VistaDie Suchmaschine Alta Vista bietet bereits im einfachen Anfragemodus sehr viele nützliche und einleuchtende Funktionen, um eine Suchanfrage einzuschränken: Wörter, die unbedingt in einem Dokument enthalten sein sollen, werden mit einem + eingeleitet, und Wörter, die nicht enthalten sein sollen mit einem -. Eine Anfrage wie +science -fiction sucht z.B. nach Dokumenten, die den Begriff ,,science`` nicht aber den Begriff ,,fiction`` enthalten. Mit + und - lassen sich so sehr schnell komplexe Anfragen gestalten, ohne auch je etwas von Logik gehört haben zu müssen.Aber Alta Vista gehört zu den wenigen Suchmaschinen, bei denen man noch andere Informationen eines WWW-Dokumentes, wie z.B. den Titel oder die URL berücksichtigen kann. Mit diesen zusätzlichen Operatoren lassen sich auch gänzlich andere Anfragen stellen, z.B. kann man Abfragen, welche Seiten auf eine bestimmte Seite verweisen (das sog. ,,Rückwärts-Surfen``). Es folgt eine Übersicht dieser zusätzlichen Operatoren (gleich mit Beispielen, d.h. ein Klick auf den Link startet die Suchanfrage):
|
40.073 Antworten zum Zeitpunkt, als dieser Artikel entstand. |