C, PHP, VB, .NET

Дневникът на Филип Петров


* Мета тагове

Публикувано на 30 август 2009 в раздел ХHTML.

Още в първата статия въведохме понятието „мета информация“ и го преведохме като „информация за информацията“. Мета таговете се използват за две главни цели – подаване на команди към браузъра и „скрито“ за потребителя описание на съдържанието на страницата.

1. meta http-equiv – мета тагове за команди към браузъра. Синтаксиса на тези тагове е следния:

<meta http-equiv=“име“ content=“стойност“ />

Във всички примери досега винаги използвахме един такъв мета таг. Той беше следния:

a) <meta http-equiv=“content-type“ content=“text/html; charset=UTF-8″ /> – дефинира „content-type“ (съдържание на страницата) като text/html формат с кодировка UTF-8. Изключително рядко се използва нещо различно от „text/html“, но кодировката може да бъде друга:

– KOI8-R – често срещана кодировка специално за руски език;
– iso-8859-1 – латински езици;
– iso-8859-2 – източно европейски езици като чешки, полски, унгарски и румънски;
– iso-8859-3 – „умрелия“ език есперанто;
– iso-8859-4 – естонски, латвийски и литовски;
– iso-8859-5 – кирилица;
– iso-8859-6 – арабски;
– iso-8859-7 – гръцки;
– iso-8859-8 – еврейски;
– iso-8859-9 – турски;
– iso-8859-10 – гренландски и лапландски;
– iso-8859-11 – тайландски;
– iso-8859-12 – келтски;
– iso-8859-13 – балтийски езици, които липсват в iso-8859-4;
– iso-8859-14 – келтски (подобeн на iso-8859-12);
– iso-8859-15 – същият като iso-8859-1, но съдържа и символа за Евро;
– iso-8859-16 – същият като iso-8859-2, но съдържа и символа за Евро.

Има и редица други кодировки. Например в близкото минало много често използван в България беше windows-1251, което е друг вид кодировка на кирилица. Това днес довежда до проблеми по мигрирането на стари сайтове към нови. Почти всички кодировки обаче вече се заместват от универсалния стандарт UTF-8. Все пак ето изброени стандартните кодировки за Windows:

– windows-1250 – чешки, полски, унгарски, румънски, хърватски, словашки, словенски, албански и немски;
– windows-1251 – кирилица;
– windows-1252 – латински езици;
– windows-1253 – гръцки;
– windows-1254 – турски;
– windows-1255 – еврейски;
– windows-1256 – арабски;
– windows-1257 – естонски, латвийски и литовски;
– windows-1258 – виетнамски.

б) <meta http-equiv=“Refresh“ content=“10;URL=https://www.cphpvb.net/“ /> – „Refresh“ означава, че страницата ще се „презареди“. Стойност 10 означава, че това ще стане след 10 секунди. Допълнителните данни в URL пък дават възможност да укажем какво точно да се презареди в текущия прозорец. С други думи това е един (остарял) метод за пренасочване от стар адрес на сайт към нов. Без URL се използва за сайтове с динамично съдържание, което се обновява често. Тази техника обаче също е заместена от много по-удобни и гъвкави инструменти. С други думи – едва ли ще ви се наложи да използвате refresh.

в) <meta http-equiv=“expires“ content=“Sun, 30 Aug 2009 20:00:00 GMT“ /> – указва на браузъра кога текущото съдържание на страницата става неактуално. Така ако браузъра има cache с информация преди тази дата и час, а те са преминали, то той няма да използва cache-а, а ще зареди страницата наново от сървъра. Използва се рядко, но понякога може да бъде много полезно. Например ако имаме някакво събитие на сайта – да кажем откриване на дадена промоция точно в определен ден и час.

г) <meta http-equiv=“cache-control“ content=“no-cache“ /> – указва на браузъра въобще да не пази cache. Други възможни стойности са „public“ (свободно кеширане), „private“ (кеширане само за лично ползване) и „no-store“ (може да се кешира, но не и архивира). Почти винаги този мета таг се използва заедно със следващия в списъка.

д) <meta http-equiv=“Pragma“ content=“no-cache“ /> – контролира кеширането за прокси сървъри. Стойностите са като при таг „cache-control“. Истината е, че прокси сървърите рядко се „вълнуват“ от наличието на този таг.

е) <meta http-equiv=“Content-Language“ content=“bg“ /> – указва на търсачките какъв е езика на страницата. Използва се при категоризация и „таргетиране“ на търсенията.

ж) <meta http-equiv=“Set-Cookie“ content=“name=value;expires=Monday, 15-Mar-2010 02:12:00 GMT; path=/“ /> – остарял и вече почти забравен метод за слагане на cookie в клиентския браузър. Удобен е само за cookie със статична информация, а това вече е доста рядко срещана нужда.

з) <meta http-equiv=“Content-Script-Type“ content=“text/javascript“ /> – дефинира езикът за скриптови езици, който се използва по подразбиране в страницата. Други възможни стойности например са „text/tcl“ и „text/VBScript“. Силно препоръчваме да НЕ използвате този мета таг и винаги когато използвате скриптови езици изрично да указвате какви са те.

и) <meta http-equiv=“Content-Style-Type“ content=“text/css“ /> – дефинира езикът за описание на стилове, който се използва по подразбиране в страницата. Засега единствената възможна стойност е „text/css“, което прави тагът безполезен. Дори и в бъдеще да се появят алтернативи на CSS, отново е в сила препоръката от предишния изброен таг – по-добре сами описвайте данните и не разчитайте на несигурни методи за дефиниране на стойности по подразбиране. Все още браузърите не спазват стриктни стандарти що се отнася до мета таговете.

2. meta name – тагове, които дават синтезирана информация за страницата. Използва се от търсачки и ботове, които индексират страници в интернет. Общия синтаксис е:

<meta name=“име“ content=“стойност“ />

a) <meta name=“author“ content=“Филип Петров“ /> – указва авторът на информацията в страницата.

б) <meta name=“description“ content=“Описание на често използвани мета тагове“ /> – кратко описание на страницата – не повече от 150 до максимум 200 символа! Това например понякога е текстът, който се появява под връзките на намерените резултати в Google.

в) <meta name=“keywords“ content=“мета, тагове, http-equiv, meta tags“ /> – ключови думи за страницата разделени със запетаи. Не е добре да използвате дълги ключови думи (изречения). Избягвайте повторенията на думи и гледайте думите да отговарят на съдържанието на страницата ви.

г) <meta name=“copyright“ content=“&copy; 2009 Филип Петров“ /> – информация за авторското право на страницата.

д) <meta name=“reply-to“ content=“philip@abv.bg“ /> – адрес на електронна поща за връзка с автора на страницата.

е) <meta name=“robots“ content=“all“ /> – рядко използван еквивалент на популярния robots.txt. Чрез този мета таг се дава информация за индексиращите ботове и търсачките. Възможните стойности са all (пълно индексиране на страницата и нейните връзки), none (забрана за каквато и да е индексация), index (индексира текущата страница), follow (следва връзките), noindex (не индексира текущата страница) и nofollow (не следва връзките). Така например комбинацията „index, follow“ е еквивалентна на „all“, а „index, nofollow“ ще укаже „индексирай само текущата страница, но НЕ следвай нейните връзки. В днешно време за съжаление все по-малко търсачки се съобразяват с нашите изисквания.

ж) <meta name=“googlebot“ content=“noarchive“ /> – указва специално за най-популярния бот (този на google) да не пази страницата в Google Cache. Други възможни стойности са всички познати от мета таг „robots“, както и един допълнителен – nosnippet (без архивиране в Google Cache дори на частична информация).

з) <meta name=“revisit-after“ content=“30 days“ /> – указва на търсачката, че най-вероятно съдържанието на страницата ще бъде обновено след 30 дни. По този начин насърчаваме търсачките да обновяват индексите си по-често. Не злоупотребявайте, защото ако лъжете, то може да получите „наказание“ от търсачката и да ви бъде смъкнат ранга.

и) <meta name=“distribution“ content=“global“ /> – много рядко използван мета таг. Чрез global (по подразбиране) указваме, че съдържанието на страницата е с международно значение, чрез local, че е с местно, а чрез iu казваме, че е само за лично ползване (internal use).

й) <meta name=“rating“ content=“general“ /> – указва типа съдържание на страницата и целевата му група. Възможни стойности са:
– general: използва се от всички възрастови групи;
– mature: съдържание само за възрастни. Задължително е да бъде поставено при съдържание с насилие или порнография, защото се използва от филтрите на браузърите;
– restricted: само за отбран кръг посетители (обикновено се слага на страници, които са защитени с парола);
– 14 years: страница предназначена за деца до 14 години – по този начин насърчаваме търсачките да извеждат съдържанието на по-предна страница, когато се използват филтри за контрол на деца;
– safe for kids: указваме, че страницата е напълно безопасна за деца въпреки, че е предназначена предимно за възрастни.

к) <meta name=“pubdate“ content=“2009-08-30″ /> – указва на коя дата е публикувана страницата. По този начин търсачките се ориентират за актуалността на информацията.

л) <meta name=“generator“ content=“WordPress 2.8.4″ /> – името на софтуера, с който е генерирана вашата HTML страница. Аз например си пиша статиите през WYSIWYG рекадтора на блога WordPress и затова редактора на всички мои страници е дефиниран автоматично като „WordPress“ последван от версията. Обикновено редакторите сами слагат тази информация, а този мета таг се използва само и единствено за статистическа информация.

м) <meta name=“publisher“ content=“WordPress 2.8.4″ /> – идентичен с <meta name=“generator“… />.  Обикновено не се използва.

н) <meta name=“designer“ content=“Philip Petrov“ /> – името на дизайнера на уеб страницата. Обикновено се слага от фирми изработващи уеб сайтове, хора изработващи шаблони или просто дизайнери поддържащи даден уебсайт.

о) <meta name=“abstract“ content=“…“ /> – обикновено се слага само на страници съдържащи научни публикации. В този таг се слага резюмето на статията. Засега никой не използва този таг.

п) <meta name=“title“ content=“website title“ /> – по-скоро препоръчвам да не използвате този таг или ако го правите да слагате същата информация, каквато се намира в таг <title>…</title>. Навсякъде пише, че ефектът от използването на този таг е спорен и по-скоро не трябва да го ползвате.

р) <meta name=“subject“ content=“тема на страницата“ /> – отново има отношение към научните статии и в него се пише научната област. Както и при „abstract“ – засега нито търсачки, нито браузъри използват този таг.

с) <meta name=“classification“ content=“business“ /> – стойност, която подсказва на порталите как да категоризират вашата страница. Стойностите могат да бъдат какъвто искате текст, но силно се препоръчва ако въобще ползвате този таг, то да използвате някоя стандартна дума от големите портали (art, education, sport, news, и т.н.). Практически на мен този таг ми е „помагал“ само един единствен път, когато при добавяне на сайт към списъка на портал беше избрана вярната категория автоматично. Тъй като това е много рядка операция – може би ще е добре да спестите на посетителите на сайта изтеглянето на няколко байта и ще си избирате категорията в порталите сами.

т) <meta name=“owner“ content=“Philip Petrov“ /> – указва кой е собственика на уеб страницата/сайта – име на човек или компания. Може би го използвайте тогава, когато собственика на сайта е различен от автора на конкретната статия – има логика за корпоративни блогове, форуми, и т.н. Все пак имайте предвид, че едва ли някоя търсачка или браузър използва този таг.

Надявам се, че информацията и препоръките ми ще ви бъдат полезни…

 



Добави коментар

Адресът на електронната поща няма да се публикува


*