Раздзел 6. Як ўладкованыя пошукавыя сістэмы - IT1306: Аптымізацыя і прасоўванне сайтаў у Інтэрнэт - Бізнес-інфарматыка

  1. дамены Вельмі важна разумець, дзе знаходзяцца межы зоны індэксавання пошукавіка, якія сайты можна...
  2. Глыбіня і аб'ём індэксацыі

дамены

Вельмі важна разумець, дзе знаходзяцца межы зоны індэксавання пошукавіка, якія сайты можна ў ім знайсці, а якія няма, якія сайты можна дадаць у пошукавік, а якія няма. Хоць «Яндэкс» і «Рамблер» - пошукавыя машыны па рускамоўных сайтаў, гэта значыць па Рунэце, гэта не значыць, што яны індэксуюць толькі сайты з імёнамі ў зоне .ru. У абодва пошукавіка можна дадаць сайт з пашырэннем .com, .info і іншымі, але пры гэтым ён павінен быць на рускай мове. Да сайтаў з гэтых і іншых даменных зон «Яндэкс» і «Рамблер» дабіраюцца і самі, калі на іх вядуць спасылкі з рэсурсаў, ужо вядомых дадзеных пошукавікам. З 2007 года «Яндэкс» «перайшоў мяжу» і пачаў самастойна індэксаваць сусветнай Інтэрнэт, у цяперашні час ён "ведае" ужо мільярды англамоўных старонак.

Google, які пазіцыянуе сябе як сусветную пошукавую машыну, натуральна, індэксуе наогул любыя сайты ва ўсіх даменных зонах.

Якія дакументы індэксуюць пашукавікі?

Пратакол HTTP (англ. HyperText Transfer Protocol) - методыка перадачы вэб-старонак па сетцы Інтэрнэт.

Першапачаткова мэтай пошукавікаў было праіндэксаваць вэб-старонкі, гэта значыць тэксты ў фармаце HTML, выкладзеныя на сайт і якія адлюстроўваюцца вэб-серверам па пратаколе НТТР. Пазней выявілася, што шмат карыснай інфармацыі выкладзена ў Інтэрнэце ў выглядзе артыкулаў, прэйскурантаў, дакументацыі, кіраўніцтваў і да т. П. Ў розных «офісных» фарматах. Таму большасць пошукавікаў некалькі гадоў таму пачалі індэксаваць выкладзеныя на сайтах дакументы ў фарматах MS Word, PDF, MS Excel. Шырокае распаўсюджванне дынамічных старонак у фармаце Flash прымусіла пошукавікаў індэксаваць і тэксты, схаваныя ўнутры гэтага фармату файлаў.

Шырокае распаўсюджванне дынамічных старонак у фармаце Flash прымусіла пошукавікаў індэксаваць і тэксты, схаваныя ўнутры гэтага фармату файлаў

Старонка пашыранага пошуку "Яндэкса"

Аднак не варта разлічваць на індэксацыю вашай інфармацыі ў гэтых экзатычных для Інтэрнэту фарматах, паколькі няма гарантыі, што пошукавік праіндэксуюць іх добра. Калі ёсць магчымасць, любыя важныя тэксты заўсёды варта дубляваць на сайце ў фармаце HTML.

Напрыклад, трэба заўсёды мець прэйскуранты ў выглядзе звычайнай вэб-старонкі, таму што да прэйскуранта ў фармаце Excel пошукавік можа не дабрацца, а калі і дабярэцца, то індэксацыя, пошук і паказ яго ў выніках пошуку будуць абавязкова кульгаць, паколькі пашукавікі не ўмеюць разбіраць структуру Excel-файлаў настолькі ж добра, як HTML-старонкі.

Пастаянна з'яўляюцца навіны і чуткі пра тое, што Google або «Яндэкс» пачалі нарэшце ў нейкай ступені «разумець» JavaScript. Пакуль, тым не менш, спадзявацца на гэта не варта.

Заўважым, што пошукавікі ня індэксуюць тэксты, якія выводзяцца на экран карыстальніка дынамічна рознымі праграмнымі сродкамі накшталт JavaScript . Яны так жа нябачныя для пошукавіка, як і тэксты ў графічным выглядзе, пра якія гаварылася вышэй.

Глыбіня і аб'ём індэксацыі

Наколькі глыбока пошукавік «закопваецца» у сайт і ці ёсць якія-небудзь абмежаванні?

Тэарэтычна такіх абмежаванняў няма, аднак на практыцы пошукавік не стане выпампоўваць з вашага сайта мільёны старонак (калі яны там ёсць). Бо акрамя вашага сайта ў пошукавіка у чарзе на індэксацыю каштуюць мільёны іншых сайтаў, таму ён стараецца за адзін раз, за ​​адзін праход ўзяць з кожнага сайта некаторы разумнае колькасць старонак. У наступным цыкле індэксацыі пошукавік можа ўзяць яшчэ нейкая колькасць вашых старонак і т. Д. Каб не браць кожны раз занадта шмат, пошукавік імкнецца не апускацца па спасылках ўнутр вашага сайта занадта глыбока.

Гэта азначае, што нават пры вялікай колькасці старонак сайт павінен быць разумна арганізаваны - скажам, не павінна быць старонак, да якіх можна дабрацца толькі па ланцужку з дзесяці спасылак. У раздзелах " Як зрабіць сайт даступным для пошукавых сістэм »І« Карэкцыя сайта для прасоўвання ў пошукавых сістэмах »Мы раскажам пра гэта падрабязней.

Якія дакументы індэксуюць пашукавікі?