Sekcja 6. Jak zorganizowane są wyszukiwarki - IT1306: Optymalizacja i promocja strony w Internecie - Informatyka biznesowa

  1. Domeny Bardzo ważne jest, aby zrozumieć, gdzie są granice strefy indeksu wyszukiwarki, które witryny...
  2. Głębokość i objętość indeksowania

Domeny

Bardzo ważne jest, aby zrozumieć, gdzie są granice strefy indeksu wyszukiwarki, które witryny można w niej znaleźć, a które nie, które witryny można dodać do wyszukiwarki, a które nie. Chociaż Yandex i Rambler są wyszukiwarkami na stronach rosyjskojęzycznych, to znaczy w Runecie, nie oznacza to, że indeksują tylko strony o nazwach w strefie .ru. W obu wyszukiwarkach możesz dodać witrynę z rozszerzeniem .com, .info i innymi, ale musi być także w języku rosyjskim. Witryny z tych i innych stref domenowych „Yandex” i „Rambler” same też się dostają, jeśli są połączone z zasobami znanymi już z tej wyszukiwarki. Od 2007 roku Yandex „przekroczył granicę” i zaczął niezależnie indeksować globalny Internet, obecnie „zna” miliardy stron w języku angielskim.

Google, który pozycjonuje się jako globalna wyszukiwarka, naturalnie indeksuje wszystkie witryny we wszystkich strefach domen.

Jakie dokumenty indeksują wyszukiwarki?

Protokół HTTP (English HyperText Transfer Protocol) to metoda przesyłania stron internetowych przez Internet.

Początkowo celem wyszukiwarek było indeksowanie stron internetowych, to znaczy tekstów w formacie HTML, przesyłanych na stronę i wyświetlanych przez serwer WWW przy użyciu protokołu HTTP. Później okazało się, że wiele przydatnych informacji zostało opublikowanych w Internecie w postaci artykułów, cenników, dokumentacji, podręczników itp. W różnych formatach „biurowych”. Dlatego kilka lat temu większość wyszukiwarek zaczęła indeksować dokumenty publikowane na stronach internetowych w formatach MS Word, PDF, MS Excel. Szeroka dystrybucja dynamicznych stron w formacie Flash wymusiła na wyszukiwarkach indeksowanie i tekst ukryty w tym formacie pliku.

Szeroka dystrybucja dynamicznych stron w formacie Flash wymusiła na wyszukiwarkach indeksowanie i tekst ukryty w tym formacie pliku

Strona wyszukiwania zaawansowanego „Yandex”

Nie należy jednak liczyć na indeksowanie informacji w tych egzotycznych formatach w Internecie, ponieważ nie ma gwarancji, że wyszukiwarka dobrze je indeksuje. Jeśli to możliwe, wszelkie ważne teksty powinny być zawsze powielane na stronie w formacie HTML.

Na przykład zawsze powinieneś mieć cenniki w postaci zwykłej strony internetowej, ponieważ wyszukiwarka może nie dostać się do cennika w formacie Excel, a jeśli tak, indeksowanie, wyszukiwanie i wyświetlanie w wynikach wyszukiwania będzie bezwładne, ponieważ wyszukiwarki nie wiedzą, jak przeanalizować strukturę. Pliki Excel są tak dobre jak strony HTML.

Ciągle pojawiają się wiadomości i pogłoski, że Google lub Yandex w końcu do pewnego stopnia „rozumieją” JavaScript. Jak dotąd jednak poleganie na tym nie jest tego warte.

Należy pamiętać, że wyszukiwarki nie indeksują tekstów wyświetlanych na ekranie użytkownika przez dynamicznie różne narzędzia programowe, takie jak Javascript . Są również niewidoczne dla wyszukiwarki, a także teksty w formie graficznej, o których mowa powyżej.

Głębokość i objętość indeksowania

Jak głęboka jest wyszukiwarka „kopie” w witrynie i czy są jakieś ograniczenia?

Teoretycznie nie ma takich ograniczeń, ale w praktyce wyszukiwarka nie pobierze milionów stron z Twojej witryny (jeśli są). W końcu, oprócz twojej strony internetowej, wyszukiwarka w kolejce do indeksowania kosztuje miliony innych stron, więc próbuje od razu, w jednym przejściu, zabrać z każdej strony rozsądną liczbę stron. W następnym cyklu indeksowania wyszukiwarka może zabrać więcej twoich stron itp. Aby za każdym razem nie zajmować zbyt wiele, wyszukiwarka stara się nie zanurzać zbyt głęboko w linkach w witrynie.

Oznacza to, że nawet przy dużej liczbie stron witryna powinna być odpowiednio zorganizowana - na przykład nie powinno być stron, do których można dotrzeć tylko za pomocą łańcucha dziesięciu linków. W sekcjach „ Jak udostępnić stronę internetową dla wyszukiwarek „I” Korekta strony internetowej do promocji w wyszukiwarkach »Opowiemy o tym bardziej szczegółowo.

Jakie dokumenty indeksują wyszukiwarki?