Podział wyszukiwarek
Wyszukiwarki oparte na analizie treści
strony
Ponieważ Internet rośnie znacznie szybciej niż
jakakolwiek grupa ludzi może go katalogować, oraz z powodu
wad katalogów (np. pod danym hasłem może znajdować się
tysiące stron), powstały wyszukiwarki, które przeszukują
Internet analizując zawartość stron. Kiedy użytkownik
poda wyszukiwarce zapytanie, ona odpowie mu łączami do
stron, które uzna, w zależności od użytego algorytmu,
za najbardziej odpowiednie.
Wyszukiwarki oparte na tej zasadzie mogą objąć
znacznie większą część sieci niż
katalogi. Niestety są one bardzo podatne na nadużycia, przez
co użytkownik zamiast użytecznych informacji dostaje linki
na strony nie mające nic wspólnego z jego zapytaniem. Szczególnie
wyspecjalizowały się w tym strony pornograficzne.
Wyszukiwarki oparte na analizie
topologii sieci
Żeby przeciwdziałać temu, wyszukiwarki zaczęły
stosować analizę topologii sieci. Tak więc stronę
uważa się za odpowiadającą zapytaniu "britney
spears", jeśli wiele stron na temat "britney
spears" do niej linkuje. Strona porno z nagimi zdjęciami Britney,
niezależnie od własnej treści, i niezależnie od całkowitej
liczby linków (głównie z innych stron porno) na nią, nie będzie
w ten sposób uznana za związaną z tematem. Natomiast jeśli
zada się zapytanie "britney spears nude", strona ta
zostanie uznana za istotną, ponieważ linkuje na nią
wiele stron o tematyce "nude".
Początkową istotność na podstawie prostej heurystyki,
po czym zwykle używa się algorytmu losowego skakania po
linkach.
Pierwszą wyszukiwarką, która zastosowała
zaawansowane algorytmy analizy topologii sieci był Google
(http://www.google.com/
).
Wyszukiwarki oparte na analizie topologicznej są często
uważane za bardzo odporne na nadużycia. W rzeczywistości
stosunkowo czestym atakiem są spam-systemy automatycznej wymiany
linków. Inną formą ataku jest stworzenie dużej ilości
gęsto linkowanych stron, z czego wszystkie na ten sam temat. Jest
to jednak zadanie trudne i wymagające dużego nakładu
pracy, a modyfikując heurystykę wartości początkowych
można znacznie ograniczyć ten proceder, którego skala na
razie jest minimalna.
Wyszukiwarki oparte na zasadzie aukcji
miejsc
Osobnym pomysłem jest wprowadzony przez Overture
(http://overture.com/
) system, gdzie strony płacą wyszukiwarce kilka centów za
każde kliknięcie, przy czym miejsca są licytowane -
strona która daje więcej za kliknięcie znajdzie się wyżej
na liście rezultatów. Pozycje płatne są oznaczone jako
takie, razem z ceną. System ten jest korzystny dla właścicieli
stron - płacą oni tylko za wejścia nie za wyświetlenia.
Twórcy twierdzą, że jest on również korzystny dla
użytkownika, gdyż tylko strony, które oferują coś
użytecznego z danej dziedziny mogą sobie pozwolić na
taką reklamę. Z drugiej jednak strony wiele użytecznych
stron jest niekomercyjnych, a nawet przy stronach komercyjnych wyniki
będą często nieoptymalne - np. na taką reklamę
nie mogą sobie pozwolić strony, które mają niskie marże
i oferują produkty po niskich cenach, a jedynie te, które mają
wysokie marże i oferują produkty drożej.