Internet und SuchmaschinenErstellt von Penn Jack Wang , 3. Fachsemester Informatik
Kann man sich das sinnvolle Arbeiten im Internet ohne Suchmaschine vorstellen? Wahrscheinlich kaum. Vor zehn Jahren hingegen gab es noch nicht einmal das Wort 'Suchmaschine' in der deutschen Sprache, und auch heute sucht man's im Duden oder Brockhaus vergeblich. In der Realität des Internet haben die Suchmaschinen jedoch einen dramatischen Aufschwung erlebt.
Das Internet enthält eine gigantische Informationsmenge, die größte, die der Mensch jemals geschaffen hat. Gerade deshalb aber ist das Auffinden brauchbarer Informationen eine nicht ganz einfache Aufgabe. Stellen Sie sich die Bücher einer Bibliothek auf einem Haufen vor - kaum jemand wäre in der Lage, in akzeptabler Zeit das gewünschte Buch herauszusuchen. Jetzt stellen Sie sich alle Bibliotheken der Welt auf einem Haufen vor. Ungefähr so sieht es im Internet aus.
Ohne Suchmaschinen wären Rechercheaufgaben im Web von vornherein zum Scheitern verurteilt. Aber auch mit diesen unentbehrlichen Helfern ist der Erfolg nicht garantiert. Suchmaschinen haben so ihre Tücken: entweder ist das Gesuchte gerade nicht erfaßt oder aber der Suchende wird umgekehrt von der Menge des Gefundenen 'erschlagen'.
Die Internetsuchmaschinen haben ständig gegen den Zuwachs des Internet zu kämpfen. Denn das WWW umfasst ca. 5 Milliarden Seiten,
davon kommen täglich 7 Millionen hinzu.
Es gibt mehrere Suchwerkzeugarten , hier werden nur die üblichen beschrieben, nämlich Kataloge, Suchmaschinen und Metasuchmaschinen.
Bei einem Katalog handelt es sich um ein von Menschenhand zusammengestelltes Suchangebot.
Dabei ist es in Kategorien eingeteilt und sehr übersichtlich gestaltet.
Meistens verbirgt sich hinter einen Katalog eine nach alphabetisch und Kriterien geordnete Liste.Der Vorteil eines Katalog ist,
daß die Seiten meist recht gute Qualität aufweisen, da sie von den Redakteure begutachtet werden. Ausserdem
sind die Themen sehr gut eingeteilt. Der Nachteil bei Katalogen ist, daß sie nur einen kleinen Teil des WWW
einnehmen und nicht mit den Wachstum des WWW mithalten können .
Beispiele einiger Kataloge: Yahoo!, Universität Hamburg Seite,...!
Suchmaschinen gegenüber Katalogen sind komplexer aufgebaut. Suchanfragen werden durch komplexe Suchalgorithmen behandelt.
Danach benutzt die Suchmaschine sogenannte Roboter , die die Webseiten durchforsten und Links folgen.
Die Suchergebnisse werden dann in Datenbanken angeordnet. Um an einen erfolgreichen Ergebnis zu kommen , müssen schon boolsche
Suchanfragen gestellt werden. Boolschen Ausdrücken sind zum Beispiel: "OR" und "AND"! Die Gewichtung von Suchergebnissen ist
von Suchmaschine zu Suchmaschinen verschieden(Suchranking). Das Suchranking beschränkt sich entweder auf die Anzahl der Besucher
der Webseite oder der Wichtigkeit der Links. Die Vorteile der Suchmaschinen können positiv als auch negativ angesehen werden. Zum einen
erfasst die Suchmaschinen mehr Webseiten als Kataloge, dennoch sind es gegenüber des gesamten WWW nur 16 Prozent.
Man findet zwar meistens den eingegebenen Suchbegriff , dennoch wird man von der Masse der Suchergebnisse erschlagen.
Was zusätzlich zur den ständigen WWW-Wachstum kommt, ist das viele Inhalte der Webseiten oft veraltet sind oder sie
führen zu toten Links.
Beispiel einiger Suchmaschinen: Altavista,Google,
Lycos,...! Inzwischen gibt es über 1000 Suchmaschinen!
Falls es den Benutzer immernoch nicht zu einen erfolgreichen Ergebnis gelungen ist, bieten Metasuchmaschinen das parallele Suchen an. Das bedeutet, daß sie mehrere herkömmliche Suchmaschinen gleichzeitig durchsuchen und dann ein zusammengestelltes Suchergebnis ausgeben. Dabei muss jede Metasuchmaschine 6 von den folgenden 7 Kriterien beinhalten:
Folgende Suchwerkzeuge habe ich hier als alternative Suchwerkzeuge angegeben , da man ihnen Suchanfragen geben kann
und Suchergebnisse erzielen kann.
Die Zukunft des Suchens sieht folgendermaßen aus:
ARPA:Advance Research Project Agency
CERN:Centre Européen de Recherches Nucléaires (Europäisches Kernforschungszentrum in Genf, Schweiz).
HTTP:Hypertext Transfer Protocol (Hypertext-Übertragungsprotokoll).
HTTP ist ein Standard zur Übermittlung von HTML-Seiten im Internet.
Roboter:(siehe andere Referate)
TCP/IP:Transmission Control Protocol/Internet Protocol!
Die Daten werden in handliche Pakete zerlegt und über das Netz geschickt.
Den Weg finden sie mit der individuellen IP (Internet Protocol)-Adresse des Zielcomputers.
Dort setzt TCP die Daten wieder automatisch zusammen.
WWW: World Wide Web