Struktura URL Faceted Navigation

  1. Wyjątkowość
  2. Wybór wielokrotny
  3. Niestandardowe kodowanie URL
  4. Czy aspekty są hierarchiczne?
  5. Niezmienne wartości
  6. Zamówienie Facet
  7. Doświadczenie użytkownika
  8. Dodatki logiczne

Nawigacja fasetowana to zbiór elementów interfejsu użytkownika i funkcji, które umożliwiają filtrowanie i zawężanie widoków kategorii. W SEO, UX i ogólnych społecznościach zajmujących się tworzeniem stron internetowych toczy się dyskusja na temat najlepszego sposobu prezentacji fasetowej nawigacji w adresie URL.

Nawigacja fasetowa, taka jak filtrowanie według koloru lub przedziału cenowego, może być pomocna dla odwiedzających, ale często nie jest przyjazna dla wyszukiwania, ponieważ tworzy wiele kombinacji adresów URL z powieloną treścią.

- Fasetowana nawigacja najlepsza (i 5 najgorszych) praktyk

Prawidłowy sposób oznaczania aspektów w adresie URL polega na użyciu parametrów zapytania. Jednak niektórzy uważają, że wirtualne podkatalogi stanowią lepszą alternatywę dla SEO i UX. Porównamy różne opcje uwzględniania aspektów w adresie URL, zaczynając od uproszczonych przykładów każdej metody.

Parametry zapytania https://example.com/category?option=true Wirtualne podkatalogi https://example.com/category/filter/option/true

Wskazówka: Zarówno parametry zapytania, jak i wirtualne podkatalogi (segmenty ścieżek) są podatne na powielanie treści, jeśli nie są odpowiednio zarządzane; kanonizowanie adresów URL może pomóc w uniknięciu podwójnych kar za treści.

Aby określić, która struktura adresu URL jest najlepsza dla SEO, rozważmy zalety i wady każdej opcji zgodnie z „najlepszymi i najgorszymi” praktykami nawigacji fasetowej zdefiniowanymi przez Google.

Wyjątkowość

W idealnym stanie unikalna treść - czy to pojedynczy produkt / artykuł, czy kategoria produktów / artykułów - miałaby tylko jeden dostępny adres URL.

W związku z unikalnością adresów URL ani parametry zapytań, ani podkatalogi wirtualne nie są lepsze.

Google traktuje każdy odrębny adres URL (łącznie z tymi z parametrami zapytania) jako unikalny adres URL z unikalną treścią. Dzieje się tak dlatego, że technicznie możliwe jest, aby witryna obsługiwała różne treści pod każdym odrębnym adresem URL, a dla adresów URL, które zawierają parametry zapytania, prawdopodobne jest, że treść może się zmienić w oparciu o te wartości.

Wskazówka: Dotyczy to również adresów URL http i https oraz adresów URL, które można odwiedzać z subdomeną lub bez niej (np. Www); kanonizacja lub przekierowanie tych adresów URL pomoże uniknąć podwójnych kar za treści.

Wybór wielokrotny

Jednym z wyzwań, jakie napotykają przy konstruowaniu fasetowanych adresów URL, jest prawidłowe oznaczanie taksonomii dla wielu wartości i wielu opcji. W miarę dodawania kolejnych aspektów struktura adresów URL staje się coraz bardziej skomplikowana. Poniższe przykłady ilustrują dwa typowe podejścia do tego problemu:

  1. Parametry zapytania
    • https://example.com/category?color=black,white
    • https://example.com/category?color=black,white&size=8,10
  2. Wirtualne podkatalogi
    • https://example.com/category/filter/kolor/black,biały/
    • https://example.com/category/filter/color/black,white/size/8,10/

Podejścia te budzą obawy dotyczące prawidłowego kodowania URL.

… [Niebezpieczeństwo hierarchicznej klasyfikacji jako ogólne rozwiązanie] w filozofii znaczenia. … Ponieważ relacje między podmiotami są podobne do stron internetowych, a nie drzewiastych, nawet dla osób, które zgadzają się co do sieci, mogą wybrać inną reprezentację drzewa.

- Fajne identyfikatory URI się nie zmieniają , Tim Berners-Lee

Niestandardowe kodowanie URL

Google odradza stosowanie „niestandardowego kodowania adresów URL dla parametrów… zamiast klucza = wartość i pary”.

Google podaje dwa przykłady „najgorszej praktyki”, w których pary klucz-wartość są oznaczane niepoprawnie za pomocą: i, a nie =, i gdzie wiele parametrów jest dołączanych z [] i ,, zamiast &.

Jeśli pary klucz-wartość są prawidłowo oznaczone, istnieją prawidłowe znaki specjalne, które mogą być użyte w adresie URL.

Przecinek, na przykład, jest dozwolonym znakiem ścieżki (tj. „Pchar”) jako część separatorów podrzędnych (tj. „Sub-delim”) zdefiniowanych w RFC 3986 § 2.2 zarówno dla parametrów zapytania, jak i segmentów ścieżki. Tak jak RFC 3986 § 3.3 stwierdza:

zarezerwowane znaki średnika („;”) i równe („=”) są często używane do ograniczania parametrów i wartości parametrów mających zastosowanie do tego segmentu. Zastrzeżony znak przecinka („,”) jest często używany do podobnych celów.

Podczas gdy te znaki mogą być używane zarówno w segmentach ścieżki, jak i zapytania, rzadko widuje się te znaki w segmentach ścieżki, ponieważ ograniczanie opcji w segmencie ścieżki nie nadaje wyraźnej hierarchii .

Czy aspekty są hierarchiczne?

Sercem pytania jest to, czy aspekty są danymi hierarchicznymi.

Według Wpis Wikipedii w „Fasetowanej klasyfikacji” , aspekty nie są hierarchiczne:

Klasyfikacja hierarchiczna odnosi się do klasyfikacji obiektów za pomocą jednej hierarchicznej taksonomii . Klasyfikacja fasetowa może faktycznie wykorzystywać hierarchię w jednym lub kilku aspektach, ale pozwala na użycie więcej niż jednej taksonomii do klasyfikacji obiektów.

Jak widzieliśmy w naszych przykładach powyżej, „wiele taksonomii” przedstawionych przez aspekty nie jest dobrze dostosowane do włączenia do segmentu ścieżki adresu URL. Wracając do momentu użycia niestandardowego kodowania URL, zgodnie z RFC 3986 § 3.3 :

Komponent ścieżki zawiera dane, zwykle zorganizowane w formie hierarchicznej, wraz z danymi w niehierarchicznym komponencie zapytania ( Sekcja 3.4 ) służy do identyfikacji zasobu…

RFC 3986 § 3.4 trwa:

Komponent zapytania zawiera dane niehierarchiczne

Dzięki temu jasne jest, że aspekty nie powinny pojawiać się w segmentach ścieżki, ale powinny być wyświetlane jako parametry zapytania. W rzeczywistości Google instruuje:

Użyj parametrów (jeśli to możliwe) ze standardowym kodowaniem i parami klucz = wartość.

Używanie wirtualnych podkatalogów do oznaczania aspektów jest niestandardowe, a Google jest w stanie dokonać lepszych założeń zawartości strony, gdy aspekty są przekazywane za pomocą parametrów zapytania. Google zapewnia nawet Narzędzie Parametry URL w Konsoli wyszukiwania Google, która pozwala administratorom witryn instruować Google, jak interpretować parametry zapytania; nie ma takiego narzędzia dla wirtualnych podkatalogów.

Nawigacja fasetowana to zbiór elementów interfejsu użytkownika i funkcji, które umożliwiają filtrowanie i zawężanie widoków kategorii

Niezmienne wartości

Inną „najgorszą praktyką” zdefiniowaną przez Google jest „używanie katalogów lub ścieżek plików zamiast parametrów do wyświetlania wartości, które nie zmieniają zawartości strony”.

W opartej na katalogach strukturze adresów URL, wszystkie następujące adresy URL będą miały tę samą treść:

  • https://example.com/category/filter/option/
  • https://example.com/category/filter/
  • https://example.com/category/

Ten problem jest mniej widoczny w przypadku używania parametrów zapytania, ponieważ istnieje wyraźne rozgraniczenie między hierarchią a aspektami za pomocą par klucz-wartość. Ten problem może zostać rozwiązany za pomocą kanonizacji, ale nie jest uważany za najlepszą praktykę, jak wspomniano przez Google ; najlepsza praktyka polega na stosowaniu parametrów zapytania, ponieważ „parametry URL umożliwiają wyszukiwarkom większą elastyczność w określaniu, jak skutecznie indeksować”.

Zamówienie Facet

Niezależnie od tego, która struktura adresu URL jest używana, aspekty powinny być zawsze prezentowane w jednolity sposób (np. Kolejność alfabetyczna), więc wiele adresów URL nie jest indeksowanych dla tej samej treści. Weź jako przykład następujące adresy URL:

  • https://example.com/category?test=0,1
  • https://example.com/category?test=1,0

Oba te adresy URL wyświetlałyby tę samą treść. Aby zmniejszyć łączną liczbę unikalnych linków w witrynie, a tym samym zduplikować zawartość przed zaindeksowaniem, tylko jedna z powyższych powinna być konsekwentnie używana w całej witrynie.

Ponownie przekierowanie lub kanonizacja może pomóc wyszukiwarkom poprawnie indeksować tę treść, jeśli jest ona przywoływana gdzie indziej.

Doświadczenie użytkownika

Jako frontowy komponent witryn internetowych, adresy URL są ważną częścią doświadczenia użytkownika. Adres URL działa jako punkt odniesienia dla bieżącego widoku, a zaawansowani użytkownicy mogą używać adresu URL jako „wirtualnego śladu nawigacyjnego”, aby przechodzić wstecz do hierarchii witryny. Utrzymywanie ludzkiego parsist URL jest ważnym i nietrywialnym przedsięwzięciem.

Uwaga: napisałem obszerny post na temat znaczenia projektowania adresów URL jako części interfejsu użytkownika witryny .

Dodatki logiczne

Google odradza „dołączanie parametrów URL bez logiki”. Niepotrzebne parametry powinny zostać usunięte, aby zachować ludzką strukturę parsible URL, jeśli to możliwe. Google zaleca usunięcie informacji o sesji użytkownika z adresu URL i przechowywanie tych danych w plikach cookie. Utrzymywanie adresu URL wolnego od niepotrzebnych danych nie tylko pomaga użytkownikom zrozumieć treści obecne w bieżącym widoku, ale także pomaga SEO, jak zauważa Google:

Zewnętrzne parametry URL zwiększają tylko duplikację, powodując mniej wydajne indeksowanie i indeksowanie.

Com/category?
Com/category?
Com/category?
Czy aspekty są hierarchiczne?
Com/category?
Com/category?