Більше, ніж просто ключові слова: 7 ідей для просунутої внутрішньої оптимізації

  1. 1. Використання ключових слів
  2. 2. TF-IDF
  3. 3. Синоніми та близькі варіанти
  4. 4. Сегментація сторінки
  5. 5. Семантичне відстань і відносини між словами
  6. 6. Спільна зустрічальність і фразовое індексування
  7. 7. «Опуклість» об'єкта
  8. Практичні поради по внутрішньої пошукової оптимізації

У звичному розумінні оптимізація контенту сайту зводиться до розподілу ключових слів по тексту просуваються сторінок. Сайрус Шепард в своїй пропонує кілька прийомів для більш глибокої оптимізації контенту, зібраних по крупицях з наукових статей, патентів пошукових систем, практичного досвіду і спостережень сотень SEO-фахівців.

Одна з основних завдань маркетологів - допомогти пошуковій системі відповісти на питання «Про що ця сторінка сайту?». Пошуковики не вміють сприймати сайти, як це роблять люди, тому нам доводиться сегментувати сторінки і вбудовувати підказки. Таким чином визначається релевантність сторінки, яка допомагає видати найбільш корисні результати у відповідь на пошуковий запит користувача.

Розуміння того, як працюють пошукові алгоритми, допомагає забезпечити більш якісні сигнали, які дозволяють сторінці займати високі позиції у видачі. Google не розкриває подробиці роботи своїх алгоритмів, тому ми роками по крупицях збирали інформацію в інтерв'ю, наукових статтях, патентах і спостереженнях сотень SEO-фахівців, щоб розібратися в цих процесах. У даній статті ми розглянемо набір прийомів внутрішньої пошукової оптимізації, за допомогою яких можна значно поліпшити внутрішню релевантність сторінки сайту.

1. Використання ключових слів

На початку були ключові слова.

Ідея полягала в тому, що, якщо ваша сторінка присвячена певній темі, пошукові системи будуть шукати ключові слова у важливих областях сторінки (в тезі title, в заголовках, атрибутах alt і в самому тексті). Ці активно користувалися SEO-фахівцями для підвищення рейтингу сторінки.

Істотна частина інструментарію для внутрішньої оптимізації досі покладається на розміщення ключових слів, проте дослідження показують, що вплив цього фактора знизилося.

Розміщення ключових слів на сторінці сайту залишається необхідним мінімумом, але одне лише використання ключових слів не здатна значно вплинути на підсумки пошукової видачі.

2. TF-IDF

Це статистична міра, яка використовується для оцінки важливості слова в контексті документа, що є частиною колекції документів. Іншими словами, TF-IDF вимірюється не частоту появи ключового слова, а його значимість, засновану на тому, як часто ключове слово з'являється на сторінці в порівнянні з очікуванням, що прогнозується на основі корпусу документів.

За словами дослідників з Google, показник TF-IDF «давно використовується для індексації веб-сторінок», а варіації TF-IDF з'являлися в декількох відомих патентах Google.

Якщо порівняти слова «basket» ( «кошик») і «basketball player» ( «баскетболіст») в Google's Ngram viewer , Можна помітити, що «basketball player» зустрічається рідше, ніж «basket». Грунтуючись на цих даних про частотності, можна зробити висновок, що слово «basketball player» важливо для містить його сторінки, тоді як планка значущості для слова «basket» буде вищою.

Вивчаючи взаємозв'язок TF-IDF і високого рейтингу сторінки, ми бачимо, що вплив цього показника на результати видачі лише трохи більше, ніж використання ключових слів. Іншими словами, сам по собі високий показник TF-IDF не принесе великої користі для просування сторінки. Необхідно розглядати TF-IDF як важливий компонент інших, більш складних методів внутрішньої пошукової оптимізації.

3. Синоніми та близькі варіанти

Google обробляє понад 6 млрд. Пошукових запитів в день і володіє величезною кількістю даних, щоб визначати, що насправді мав на увазі людина, що вводить пошуковий запит. Власне дослідження Google показує, що синоніми використовуються в 70% пошукових запитів.

Для вирішення цього завдання пошукові системи мають у своєму розпорядженні величезними масивами синонімів і близьких варіантів для незліченної кількості слів. Все це дозволяє знайти потрібний контент у відповідь на пошуковий запит навіть у тих випадках, коли запит не містить ключових слів. Як приклад наведемо запит «Картинки собак», який може означати те ж, що і наступні запити:

  • фотки собак;
  • картинки з собаками;
  • картинки собак;
  • фотки з собаками;
  • фотографії собак.

З точки зору пошукової оптимізації це означає, що контент повинен бути написаний природною мовою, з використанням синонімів і близьких варіантів ключових слів, а не тільки точних відповідностей.

Крім того, використання синонімів додає більш глибокий семантичний сенс і допомагає усунути проблему неоднозначності в тих випадках, коли один і той же ключове слово називає різні поняття. Наприклад, plant ( «завод») і factory ( «фабрика») відносяться до групи слів, пов'язаних з виробництвом, тоді як plant ( «рослина») і shrub ( «чагарник») використовуються для опису рослинності.

Не будемо забувати про алгоритм Google «Колібрі» (Hummingbird), який вміє сприймати питання не як окремі слова, а як єдину фразу, і відповідати на них відповідно.

4. Сегментація сторінки

Розташування ключових слів на сторінці часто виявляється не менш важливо, ніж самі ключові слова.

Кожна веб-сторінка складається з різних частин: заголовків, підвалу сторінки, бічних колонок і т.д. Пошукові системи вже давно працюють над визначенням головної частини аналізованої сторінки. І Microsoft, і Google володіють, згідно з якими контент в більш релевантних HTML-секціях має більшу вагу.

Контент, розміщений в основному тексті сторінки, важливіше, ніж текст, розміщений в бічних колонках або в інших секціях. Повторюваний же текст в наскрізних блоках ризикує і зовсім не отримати майже ніякої уваги.

Сегментація сторінки набуває ще більшої значущості у випадку з мобільними пристроями, які нерідко приховують частину сторінки. Пошукові системи прагнуть видати користувачеві видиму, значну частину сторінки, а тому текст, розміщений в цьому сегменті, заслуговує найбільшої уваги.

HTML-5 йде ще далі і пропонує ряд додаткових семантичних елементів, таких як <article>, <aside> і <nav>, які допомагають чітко виділити сегменти в структурі веб-сторінки.

5. Семантичне відстань і відносини між словами

У контексті внутрішньої пошукової оптимізації семантичне відстань описує відносини між словами і фразами в тексті. Це не те саме, що фізична відстань між ключовими фразами; семантичне відстань описує зв'язок ключового слова з іншими словами в межах пропозиції, абзацу та інших елементів HTML-коду.

Яким чином пошукові системи розуміють, що «лабрадор» і «породи собак» пов'язані один з одним, коли ці два поняття не перебувають в одному і тому ж реченні?

Пошукові системи вирішують цю проблему, вимірюючи відстані між різними словами і фразами всередині різних HTML-елементів. Чим вище семантична близькість понять, то тісніше ці поняття пов'язані між собою. Слова і фрази, що знаходяться в одному абзаці тексту, семантично пов'язані ближче, ніж слова, розділені декількома абзацами.

Крім того, HTML-елементи можуть скоротити семантичне відстань між поняттями, просто розташувавши їх близько один до одного. Наприклад, пункти списку вважаються рівновіддаленими один від одного, а заголовок документа може вважатися близько пов'язаним з будь-яким іншим словом у документі.

Стандарт розмітки Schema дозволяє семантично структурувати текст так, щоб ясно визначити відносини між словами.

Перевага стандарту Schema полягає в тому, що пошуковим системам не потрібно будувати здогади. Всі семантичні відносини між словами чітко прописані. Складність в тому, що веб-майстрам доводиться користуватися спеціальною розміткою. Дослідження показує, що на сьогоднішній день рівень застосування цього стандарту залишається низьким.

6. Спільна зустрічальність і фразовое індексування

До сих пір ми говорили про окремі ключових словах і відносинах між ними. Однак пошукові системи застосовують методи індексації сторінок на основі цілих фраз і ранжирують сторінки за релевантністю цих фраз. Цей процес відомий як фразовое індексування.

Найцікавіше в цьому процесі не те, як саме Google визначає важливі для даної веб-сторінки фрази, а то, як Google використовує релевантність таких фраз для ранжирування сторінки.

Грунтуючись на концепції спільної зустрічальності, пошукові системи знають, що деякі фрази пророкують появу в тексті інших фраз. Якщо у вашому основному запиті згадується «Джон Олівер», можна передбачити, що ця фраза часто зустрічається разом з такими фразами як «нічний комедійне шоу», «Daily Show» і «телеканал HBO». Сторінка, на якій зустрічаються ці родинні фрази, з більшою ймовірністю буде відповідати запиту «Джон Олівер», ніж сторінка без родинних фраз.

Додайте сюди входять посилання зі сторінок, що містять родинні фрази з високою спільної встречаемостью, і ви отримаєте сторінку з потужними контекстуальних сигналами.

7. «Опуклість» об'єкта

Заглядаючи в майбутнє, можна сказати, що пошукові системи, визначаючи тематичну релевантність, досліджують можливості використання відносин не тільки між ключовими словами, а й між об'єктами.

Один з таких методів, описаний в дослідженні Google, визначає релевантність через «опуклість» об'єкта (), іншими словами значимість об'єкта в зв'язку з іншими ключовими словами і фразами.

Цей метод виходить за рамки традиційних прийомів роботи з ключовими словами (наприклад, TF-IDF) і шукає релевантні слова в документі, використовуючи вже відомі відносини між об'єктами. Під об'єктом розуміється будь-яка легко виділяється і чітко визначена частина документа.

Чим сильніше зв'язок об'єкта з іншими об'єктами сторінки, тим більш значущим стає цей об'єкт.

Стаття на наведеній діаграмі містить поняття «Залізна людина», «Тоні Старк», «Пеппер Поттс» і «наукова фантастика». Фраза «комікси Marvel» має міцну об'єктної зв'язком з усіма перерахованими поняттями. Хоча ця фраза з'являється лише один раз, її значимість у даному документі досить висока.

З іншого боку, хоча фраза «Cinerama» з'являється в статті багато разів (бо фільм показували в цьому кінотеатрі), її об'єктні зв'язки слабкіше, а тому вона менш значима.

Практичні поради по внутрішньої пошукової оптимізації

Перейшовши від розміщення ключових слів до більш просунутих методів тематичного орієнтування, ми тепер можемо з легкістю застосувати їх до нашого контенту. Хоча більшості з нас доводиться обходитися без засобів для обчислення семантичних відносин і сполучуваності об'єктів, все ж існує кілька простих способів для створення оптимізованого контенту:

  1. Пошук ключових слів - це фундамент. Хоча в наш час окремих ключових слів вже недостатньо для просування контенту, робота починається саме з ґрунтовного вивчення ключових слів. Вам потрібно знати, з якими ключовими словами ви збираєтеся працювати, розуміти їх популярність і відносну конкуренцію. В кінцевому підсумку ваша мета - зв'язати контент саме з тими ключовими словами, які користувачі вводять в рядку пошуку.
  2. Вивчайте теми. Не шукайте окремі ключові слова, замість цього досліджуйте теми, з якими вони пов'язані. Досліджуйте вторинні ключові слова. Якими словами користуються люди, кажучи про вашу темі? Які особливості вашої тематичної області? Використовуйте вторинні ключові слова і фрази як цемент, що скріплює елементи центральної теми.
  3. Створюючи контент, відповідайте на максимальну кількість питань. Якісний контент дає відповіді на питання, і це відбивається в семантично відповідним вмістом контенті. Якщо ваша сторінка виявилася на високій позиції за будь-якою запитом, значить, пошукова система вважає, що ваш контент відповідає на поставлене запитання найкраще. Структуруючи контент відповідно до певною темою, переконайтеся, що ви дійсно відповідаєте на питання і пропонуєте користувачеві найбільш зручну взаємодію, а тому заслуговуєте високих позицій.
  4. Користуйтеся природною мовою і варіаціями. У процесі виявлення ключових слів постарайтеся визначити, за допомогою яких слів користувачі говорять про вашу темі, і включіть ці слова в свій контент. Семантичний аналіз ключових слів може помітно допомогти на цьому етапі.
  5. Розміщуйте важливий контент в найважливіших секціях сторінки. Не розміщуйте важливий контент в підвалі сторінки і в бічних колонках. Не намагайтеся обманювати пошукові системи за допомогою хитрих прийомів на основі CSS або JavaScript. Найважливіший контент повинен знаходитися там, де він найбільш помітний і доступний для користувача.
  6. Структуруйте контент грамотно. Заголовки, абзаци, списки і таблиці надають вашому контенту структуру, завдяки чому пошукові системи розуміють, до якої теми ви звертаєтеся. Структура зрозумілою веб-сторінки нагадує структуру якісної наукової статті. Використовуйте введення, висновок, розбиття на абзаци, не забувайте стежити за орфографією і граматикою, правильно вказуйте посилання на джерела.

За великим рахунком нам не потрібен суперкомп'ютер, щоб зробити контент краще або доступніше для розуміння. Якщо ми будемо писати по-людськи, з розрахунком на людей, пошукова оптимізація нашого контенту завжди буде успішною.

Оригінальний текст статті читайте на сайті moz.com.

Одна з основних завдань маркетологів - допомогти пошуковій системі відповісти на питання «Про що ця сторінка сайту?
Яким чином пошукові системи розуміють, що «лабрадор» і «породи собак» пов'язані один з одним, коли ці два поняття не перебувають в одному і тому ж реченні?
Якими словами користуються люди, кажучи про вашу темі?
Які особливості вашої тематичної області?