На главную

Библиотека Интернет Индустрии I2R.ru

Rambler's Top100

Малобюджетные сайты...

Продвижение веб-сайта...

Контент и авторское право...

Забобрить эту страницу! Забобрить! Блог Библиотека Сайтостроительства на toodoo
  Поиск:   
Рассылки для занятых...»
I2R » Секреты поиска » Поисковые системы и каталоги

Как сделать, чтобы ваш сайт нашли

Поисковые системы являются одним из наиболее удобных и популярных способов поиска информации в Интернете. В предыдущей статье я касалась вопроса "раскрутки" сайта посредством успешной индексаций. Теперь остановимся более подробно на различных поисковиках и выясним, что необходимо для этого каждом из них.

Наиболее известной и мощной является поисковая система Altavista, позволяющая искать информацию на многих языках, в том числе и на русском. Ее недостатком можно считать то, что поиск по ключевому слову происходит именно в той форме, в которой вы это слово задали. Эта проблема особенно актуальна для русского языка, поэтому для поиска русскоязычной информации пользователи предпочитают обращаться к отечественным аналогам.

Из русских поисковых машин можно назвать три наиболее крупные и популярные: Апорт, Rambler и Яndex. Они обладают существенным преимуществом при поиске в русскоязычном Интеренете, т.к. учитывают морфологию. Вам не нужно ломать голову и склонять ключевые слова, поисковая машина сделает это сама.

С точки зрения пользователя механизм действия поисковых систем похож. Задавая ключевое слово или комбинацию слов, вы получает список документов, расположенных в порядке убывания их релевантности (т.е. степени соответствия запросу). Естественно, каждый владелец сайта заинтересован в том, чтобы ссылка на его ресурс выдавалась на первых страницах. Проблема заключается в том, что каждая система используется собственным механизмом определения релевантности, а значит добиться лидерства во всех поисковых системах одновременно просто невозможно. Поэтому ставьте перед собой реальные цели!

Рассмотрим подробнее каждую из поисковых систем, специфику работы и механизм определения релевантности трех ведущих русских поисковых систем.

Апорт обладает рядом достоинств. Наиболее привлекательным с точки зрения пользователя его делает удобное представление результатов поиска по запросу.

Выясним, какие факторы Апорт учитывает при сортировке документов. Во-первых, это количество искомых слов в тексте документа (в процентах) и расстояние между поисковыми словами в тексте документа. Чем чаще встречается ключевое слово в тексте, тем более релевантным считается документ. Однако не стоит рассчитывать поднять релевантность по конкретному слову, повторив его в тексте (или в другой части документа) раз двадцать подряд. Такие документы выявляются, и к ним могут быть применены "карательные меры".

Еще один важный критерий - это место в тексте, где встречаются поисковые слова. Заголовок и meta-теги (описание и ключевые слова) имеют больший вес. Однако этим надо пользоваться аккуратно, т.к. перечисление множества не отражающих сути слов только увеличит размеры документа, тем самым уменьшая значимость его реального содержания.

Апорт также учитывает внешний вид шрифта, которым набраны в тексте искомые слова (размер, жирность, цвет). Например, слова, выделенные жирным шрифтом, имеют больший вес. А вот попытки увеличить релевантность с помощью вбивания множества слов мелким шрифтом, сливающимся с цветом фона, ни к чему не приведут.

Уникальным критерием определения релевантности, применяемым только в Апорте, является так называемый Site Rank для сайтов (или Page Rank для страниц). Идея заключается в том, что учитывается количество ссылок из Интернета на данный документ и использованные в тексте ссылок слова. Логика проста: чем чаще ссылается Интернет-общественность со своих страниц на данный сайт, тем он популярнее, а значит интереснее и заслуживает того, чтобы оказаться в результатах поиска повыше. Этот критерий довольно объективен, его трудно подделать, т.к. он является результатом труда множества web-мастеров и владельцев ресурсов, каждый из которых дает ссылки на те ресурсы, которые считает интересными. Развивая идею учета ссылок, Апорт идет дальше. Если мы считаем ссылки, то почему бы ни учитывать и их текст? Если на какой-то сайт есть ссылка, состоящая из слова "оргтехника", то разумно предположить, что оно может довольно хорошо описывать содержимое сайта (причем даже в том случае, если на самом сайте это слово не употребляется - например, автор сайта оперирует исключительно термином "копировальный аппарат"). В результате, при поиске по слову "оргтехника" данный сайт должен занять довольно высокое место в списке. Этот подход значительно улучшает качество сортировки найденных документов.

Окончательный процент соответствия документа запросу строится как некая функция от всех этих показателей.

В отличие от двух других поисковиков, Апорт не применяет каких-либо специальных санкций к сайтам, пытающимся обмануть поисковую систему с помощью спама, однако добиться подобным способом ведущих позиций все равно не удастся. Поэтому не стоит писать невидимые тексты, вбивать сотни ключевых слов, не имеющих никакого отношения к содержанию документа и т.д.

Недостатком Апорта является то, что он "не понимает" фреймы. Робот, попадая на главную страницу, не может идти дальше. Он видит то же самое, что и пользователь, чей браузер не поддерживает фреймы, т.е. ... ничего. В результате внутренние страницы остаются не проиндексированными со всеми вытекающими отсюда печальными последствиями.

Rambler имеет важное отличие от двух других поисковых систем: его роботы при сканировании игнорируют поля ‹meta...keywords›. Этим способом Rambler пытается проиндексировать документ таким, каким его видит пользователь, а не таким, как хочет владелец. Подобная тактика действительно может быть целесообразной, т.к. часто владельцы злоупотребляют этими полями для того, чтобы их документы обязательно находились по определенным словам, при этом часто реальное содержание документа не соответствует данным критериям.

Не следует также использовать невидимый текст на страничке (т.е. шрифты, цвет которых соответствует цвету фона). Комментарии в документе роботы Rambler тоже не сканируют, поэтому использовать их стоит только по прямому назначению.

Базовые понятия и ключевые слова для данного сайта следует включать в html-теги (в порядке значимости): ‹title›, ‹h1 ... h6›, ‹address›, ‹b›, ‹strong›. Чем чаще слово встречается в комбинации этих полей, тем более вероятно, что поисковая система Rambler найдет ваш документ ближе к началу списка результатов поиска так же, как это делает Апорт. Конечно, использование этих тегов должно органично сочетаться с дизайном вашего сайта. Кроме того, чем ближе располагается поисковое слово к началу документа, тем больше его вес.

Максимальный размер документа для роботов Rambler составляет 200KB. Документы большего размера отсекаются до этой величины. Кроме того, считается "дурным тоном" делать документы такого размера без особой на то необходимости, т.к. это неудобно прежде всего с точки зрения обычного пользователя.

В отличие от Апорта, роботы Rambler'а умеют сканировать фреймы. Однако, их использование все равно нежелательно, т.к. каждый отдельный фрейм не может дать представление о целом документе. Это не относится к случаю, когда фреймы в документе используются исключительно для удобств навигации.

Яndex придает больший вес словам, указанным в заголовке, описании документа.Учитываютя также ключевые слова, задаваемые в meta-тегах (кстати, рекомендуется задавать по возможности уникальные ключевые слова для кажой страницы). Если слово из основного текста документа не расценено как спам и есть в ‹meta... keywords› среди первых 50, то его вес в запросе повышается, т.е. документ получает более высокую релевантность. Однако, если слово есть в ‹meta... keywords›, но отсутствует в основном (видимом пользователю) тексте, то по умолчанию документ по этому ключевому слову не найдется. Для этого нужно использовать специальный запрос #keywords=(слово).

С точки зрения Яndex'а количество повторов слова в "keywords" не может "поднять" документ в результатах поиска. На релевантность влияет только присутствие ключевого слова в тексте документа. Поэтому повторов здесь (впрочем, как и в других местах) делать не рекомендуется. Это не только не поможет продвинуть сайт повыше, но может даже помешать, если Яndex посчитает повторы спамом.

Яndex тоже "понимает" фреймы, но в этом случае время, требуемое для индексации вашего сайта может оказаться больше.

В заключение я хочу дать несколько советов, которые могут оказаться полезными с точки зрения индексации в любой из рассмотренных выше поисковых систем.

Целесообразно исключить из списка индексируемых часто изменяющиеся документы, т.к. их актуальность быстро теряется. Это можно осуществить с использованием файла robots.txt в корневой директории вашего сайта. Можно также исключить отдельные части документа, не требующие, по вашему мнению, индексации.

Делайте подписи к картинкам в теге ‹img … alt›. Это не только позволит роботу поисковой системы правильно проиндексировать ваш документ, но и поможет ориентироваться на вашем сайте пользователям, которые будут просматривать его с отключенной графикой.

При указании перекрестных ссылок в документе следует быть предельно внимательным, проверить работоспособность каждой ссылки, иначе роботы не смогут добраться в глубь дерева ваших документов. Следует также иметь в виду, что с точки зрения HTML записи типа ‹a href=directory....› и ‹a href=directory/....› (слэш в конце href) являются разными ссылками. Обычно при запросе по первой ссылке робот получит редирект на вторую, а значит, извлечет сам документ только на следующем проходе при обращении к Вашему серверу. Тем самым увеличивается время индексации вашего сайта.

При написании документов внимательно следите за соблюдением русского/латинского регистров. Часто вместо русских букв "р" и "с" используют латинские, аналогичные по написанию. Слова с подобными опечатками теряют информативность. Кроме того, старайтесь не использовать символов переноса части слова на другую строку "-". Это затрудняет определение того, является ли начало следующей строки продолжением слова или это просто дефис. Не забывайте, что браузер сам осуществляет представление документа согласно текущим установкам каждого конкретного пользователя. Не набирайте слова в р а з р я д к у, если хотите, чтобы документ по ним находился. Для этого существуют специальные приемы. Не пишите слова большими буквами без необходимости, если это не аббревиатура. Точки и запятые прижимайте к слову, за которым они стоят, после них ставьте пробел.

И главное, отнеситесь серьезно к планированию и размещению вашего сайта. Поисковые машины - вещь достаточно инерционная, пройдет достаточно много времени, прежде чем информация о вашем сайте обновится.

Светлана Радченко
cdo.cid.ru

Рассылки Subscribe.ru:

Библиотека сайтостроительства - новости, статьи, обзоры
Дискуссионный лист для web-разработчиков
Подписка на MailList.Ru
Автор: NunDesign
Другие разделы
Yandex
Поисковые системы и каталоги
Новое в разделе
Yahoo
Google
I2R-Журналы
I2R Business
I2R Web Creation
I2R Computer
рассылки библиотеки +
И2Р Программы
Всё о Windows
Программирование
Софт
Мир Linux
Галерея Попова
Каталог I2R
Партнеры
Amicus Studio
NunDesign
Горящие путевки, идеи путешествийMegaTIS.Ru

2000-2008 г.   
Все авторские права соблюдены.
Rambler's Top100