Metasuchmaschine – Wie einzigartig sind die Suchmaschinen?

Eine Metasuchmaschine fasst die Daten von verschieden Suchmaschinen zusammen. Das macht nur sinn, wenn Google, Bing und Ask nicht die selben Ergebnisse haben.
Um dieser Frage nachzugehen, haben sich der interacto e.V (als Betreiber von lixam.de), SearchUnited (Betreiber von diversen Suchmaschinen) und die RWTH Aachen zusammengeschlossen und eine groß angelegte Studie erarbeitet.

Für Deutschland wurden folgende Suchmaschinen ausgesucht:
Google.de
Ask.de
Bing.de
Fastbot.de

Hierbei ist das erste Problem aufgekommen. Google zeigt sehr viel an, was nicht zu den Suchergebnissen gehört: Places, Maps und Shopping ( http://www.google.de/search?hl=de&source=hp&q=handy&aq=f&aqi=g10&aql=&oq= ). Dies darf natürlich nicht gedacht werden. Nur beziehen uns nur auf die ersten 10 Suchergebnisse.
Das zweite Problem war, eine möglichst breite und neutrale Basis an Suchanfragen zu bekommen.
Die Unterschiede zwischen den Suchergebnissen verändern sich stark, wenn ein Suchbegriff von kommerziellen Interesse ist, oder nicht. Wenn fünf große Firmen, mit entsprechend Kapital, und den gleichen Begriff kämpfen kommt es bei den meisten Suchmaschinen zu einem ähnlichen Ergebnis.
So ist gerade bei dem Begriff Preisvergleich der Unterschied zwischen den einzelnen Suchmaschinen erschreckend gering. Auch Marken und Produktbezeichnung variieren kaum.
Wir haben uns daher einfach entschlossen, eine ganz natürliche Sammlung von Suchbegriffen zu benutzen. Wir haben einfach das ausgewertet, was unsere Nutzer wirklich in letzter Zeit gesucht haben.

Um noch ein bisschen mehr natürliche Daten zu erhalten, haben wir jede Woche zufällig eine gewisse Zahl an Suchbegriffen, die von unterschiedlichen Usern getätigt worden sind, abgespeichert. Dies haben wir einen Monat lang gemacht. So kamen wir zu einer Datenbasis von gut 20.000 Suchbegriffen. Diese entsprangen alle einer deutschen Suchmaschine, aber wahre sowohl Deutsch, als auch Englisch und ein paar generische Begriffe (wir Marken- oder Produktnamen). Wir haben hier keine weitere Unterteilung oder aus Sortierung vorgenommen. Duplikate wurde natürlich entfernt.

Bei den Marken und generischen Begriffen stand allerdings nur eine Datenbasis von knapp 3000 Begriffen zur Verfügung.

Nun zu den Ergebnissen:

Zuerst die Ergebnisse für die generischen Begriffe und Markennamen (Domains).

Die Verteilung der ersten Seite schon sehr ähnlich:

Einzig die Platzierungen unterscheiden sich:

Die Ergebnisse für alle anderen Begriffe:
hier wird deutlich wie unterschiedlich die einzelnen Suchmaschinen doch wirklich sind:

– etwa 80 % der Ergebnisse waren einzigartig eine einzelne Suchmaschine.
– etwa 10 % der Ergebnisse wurden auch bei mindestens zwei anderen Suchmaschinen      gefunden
– nur 3 % der Ergebnisse wurden bei drei der anderen Suchmaschinen gefunden
weniger als ein Prozent aller Ergebnisse wurden von allen Suchmaschinen gefunden

This entry was posted in Uncategorized and tagged , , , , , , , , , , , , , , , , , , , , , . Bookmark the permalink.