bics-Logo  
 

Home

Struktur des Internet

Suchstrategien

Suchtechniken

Suchmaschinen

Übungsaufgaben

Links
 
Suchstrategien

In dem folgenden Abschnitt werden die verschiedenen Arten beschrieben, wie man zu den gewünschten Informationen aus dem Internet gelangen kann.

1. Angabe der Adresse (URL=Universal Resource Locator )
Dies hört sich vielleicht etwas merkwürdig an, wo wir uns doch um das Finden solcher Adressen bemühen. Aber wenn man bereits etwas Erfahrung mit dem Internet hat, dann ist einem bekannt das Firmen und Institutionen an einprägsamen Namen interessiert sind. Dazu muss man allerdings grob wissen, wie Internetadressen aufgebaut sind. Eine Adresse für das WWW ist in der Regel so aufgebau :

http://www.aaa.bbb...topleveldomänkürzel/

Beispiele :
Volkswagen ist tatsächlich unter www.volkswagen.de oder
Der Elektronikversand Conrad ist unter www.conrad.de oder etwas schwieriger
Das Imax-Kino in Berlin ist unter www.imax-berlin.de zu finden.
Also nur Mut, dies ist die schnellste Möglichkeit etwas zu finden, wenn es klappt.

2. Thematische Verzeichnisse (Kataloge)  
Kataloge werden von Menschen gemacht. Eine Redaktion, nicht eine Software, besucht die angemeldeten Seiten und sortiert sie in einen Schlagwortkatalog ein. Der wird den Suchenden dann hierarchisch präsentiert. Die Basis für den erstellten Index stellen Seiten, die von den jeweiligen Verwaltern angemeldet wurden und zum Teil auch solche, die Web-Bots aufspüren. Die neu gefundenen Seiten werden zunächst redaktionell bewertet, bevor sie in den Katalog wandern.
Vorteil und Problem ist der menschliche Faktor: Es wird einerseits klar gewichtet und die Suche fördert keine Treffer, bei denen das Suchwort eher zufällig denn bestimmend vorkommt; andererseits muß sich der Redakteur für eine Kategorie entscheiden. Nicht immer ist eine eindeutige Zuordung möglich. Erleichtert wird die Arbeit der Redakteure, wenn sich die Seitenbetreiber selber möglichst präzise anmelden.
Der Katalog eignet sich gut zur Suche nach einem bestimmten Thema oder Sachgebiet. Weniger eignet er sich zur Klärung einer bestimmten Frage oder zur Beantwortung eines einzigen, spezifischen Sachverhalts.
Yahoo! - http://www.yahoo.de
Web.de - http://web.de
Dino-online - http://www.dino-online.de

3. Suchmaschinen  
Diese abfragebasierten Suchsysteme können große Teile des Webs nach konkret angegebenen Suchkriterien durchforsten. Für diese Form der Suche sind Kenntnisse über die benutzten Suchmaschinen und über Retrievaltechniken unerläßlich, dafür kann man sehr viel gezielter vorgehen und bekommt in der Regel befriedigendere Ergebnisse als beispielsweise mit Hilfe von Themenkatalogen.
Was man von Suchmaschinen erwarten kann und was nicht, ist besser einzuschätzen, wenn man weiß, wie sie arbeiten. Zwar arbeitet jede Suchmaschine anders, doch prinzipiell basiert jede auf vier Grundbestandteilen:
Das vollautomatische Suchprogramm (Robot, Spider, Crawler) folgt ausgehend von bereits bekannten Seiten allen Links in den Hypertext-Dokumenten, die er findet. Die neuen Seiten werden geladen und an das Indizierungsprogramm weitergegeben. Der Indexer analysiert ebenfalls vollautomatisch Worthäufigkeiten und -positionierungen und erstellt daraus ein sozusagen charakteristisches Profil des Inhalts der jeweiligen Seite. Diese Daten werden in das Datenbankprogramm übergeben, wo sie eingeordnet und verwaltet werden. Das Datenprogramm bearbeitet außerdem die Suchanfragen und bereitet die gefundenen Daten zu einem HTML-Dokument auf, in dem die relevantesten Treffer zuerst aufgelistet werden (Ranking). Als Benutzerschnittstelle fungiert der Web-Server, der z.B. die Useranfragen anhand eines Formulars entgegennimmt.
Bereiche, mit denen Suchmaschinen Probleme haben, sind beispielsweise Web-Seiten mit Frames. Gar nicht erreicht werden nicht-verlinkte, durch Paßwort oder Firewall geschützte und dynamisch generierte Dokumente (Datenbanken).

Altavista - http://www.altavista.digital.com
Fireball - http://www.fireball.de
Excite - http://www.excite.com
Hotbot - http://www.hotbot.com
Infoseek - http://www.infoseek.com
Lycos - http://www.lycos.de
Northern Light - http://www.northernlight.com/

4. Meta-Suchmaschinen  
Die größten der gängigen Suchmaschinen decken mit ihrem Datenbestand jeweils nur ein Drittel des gesamten Webs ab, so daß es in der Regel nicht ausreicht, bei einem gravierenden Informationsproblem nur eine Suchmaschine zu befragen. Viel Arbeit und Zeit können einem dabei die Meta-Suchmaschinen ersparen. Sie verfügen nicht über eine eigene Datenbank, sondern greifen auf die mehrerer anderer Suchmaschinen zu. Sie stimmen das eingegebene Suchkriterium auf die Syntax der einzelnen Suchmaschinen ab und initiieren eine Suche in ihnen. Von den Treffern sammeln sie nur die ersten, d.h. relevantesten ein, entfernen bestenfalls sogar Dubletten und sortieren die Treffer nochmals nach eigenen Kriterien.
Gerade für den Einstieg in eine Recherche sind Meta-Suchmaschinen geeignet, denn sie bringen in der Regel auf Anhieb brauchbare Treffer und verraten einem, welche Suchmaschine für die weitere Suche am meisten erfolgversprechend ist. Was die Relevanz der angegebenen Treffer ein wenig schmälert, ist die Tatsache, daß Meta-Suchmaschinen die speziellen Suchoptionen der einzelnen "angezapften" Suchmaschinen nie vollständig ausschöpfen können. Ebensowenig passen sie die verwendeten Suchbegriffe auf Typ und Größe der durchsuchten Datenbank an.

Metacrawler - http://www.metacrawler.de
MetaGer - http://meta.rrzn.uni-hannover.de

5. Besprechungsdienste  
Geht es bei den gesuchten Informationen eher um Qualität als um Masse, sind Besprechungsdienste genau das Richtige. Sie treffen eine Auswahl aus den im Internet angebotenen Quellen, beurteilen sie und machen diese Beurteilungen dem Interessenten zugänglich. Wenn es sich also nicht um IRGENDWELCHE Jobangebote sondern DIE beste Jobbörse im Web handeln soll, ist man mit diesen Diensten gut bedient.

Magellan - http://www.mckinley.com
Webtip - http://www.webtip.de
Clearinghouse - http://www.clearinghouse.net

6. Spezialsuchsysteme

6.1 E-Mail-Adressen  
Das Regionale Rechenzentrum Niedersachsen (RRZN) bietet mit MESA (Meta Email Search Agent) einen Meta-Dienst zum Bereich E-Mail-Adressen an, der auf die Datenbestände von sieben E-Mail-Suchmaschinen zugreift.

MESA des RRZN - http://mesa.rrzn.uni-hannover.de
Internet Address Finder - http://www.iaf.net
Bigfoot - http://www.bigfoot.com
Four 11 - http://www.four11.com
Infospace - http://www.infospace.com/info/email.htm
Populus - http://www.populus.net
Suchen.de - http://www.suchen.de
Swiss.Info - http://www.swissinfo.ch/email

6.2 Zeitschriftenartikel  

Paperball - http://www.paperball.de
German Online Kiosk - http://www.gok.de
Süddeutsche Zeitung - http://www.sueddeutsche.de

6.3 Firmen  
Auch hier gibt es wieder eine Meta-Seite, die BizLinx Deutschland, die Branchenverzeichnisse und Gelbe Seiten zusammenstellt.

BizLinx Deutschland - http://www.bizlinx.de/
Flix-Branchenindex - http://www.flix.de
Yahoo! Branchenbuch - http://branchenbuch.yahoo.de
Deutsches Branchenbuch - http://www.branchenbuch.com
International Yellow Pages - http://www.mcp.com/nrp/wwwyp

6.4 Newsgroups  

DejaNews - http://www.dejanews.com
Reference - http://www.reference.com
Newsgroups (im Entstehen) - http://www.newsgroups.de

6.5 Mailinglisten  

Liszt - http://www.liszt.com
Directory of scholarly and professional E-Conferences - http://www.n2h2.com/KO-VACS

 

Seitenanfang   Startseite   Internet  
[ Aufgaben | Stichworte | Wir über uns | e-Mail | intern ]

verantwortlich: Lutz Westphal - Copyright © 2000 by BICS. Alle Rechte vorbehalten.