Главная    Почта    Новости    Каталог    Одноклассники    Погода    Работа    Игры     Рефераты     Карты
  
по Казнету new!
по каталогу
в рефератах

Поисковые системы

кроется сам документ (в зависимости от настроек, в новом или том же окне. Если вместо заголовка показывается адрес страницы, значит, ее заголовок (title) не задан.
Найденные слова
Ссылка «Найденные слова» открывает окно, в котором в тексте найденного документа цветом фона подсвечены слова запроса. Красные стрелки рядом с каждым словом позволяют передвигаться вперед-назад по списку найденных слов. Ссылки «первое слово» и «последнее слово» дают возможность найти первое и последнее вхождение слов запроса в текст документа. Ссылка «Посмотреть сохраненную копию» показывает текст документа (без форматирования) в том виде, в каком он был в момент индексации. Даже если оригинал документа не открывается, или был изменен, вы всегда можете увидеть его копию. Ссылка «Найти похожие документы» аналогична ссылке Похожие документы в результатах поиска.
Фрагмент текста
Аннотация документа составляется на основе его текста, из которого извлекаются предложения или их части, содержащие слова запроса. Если Яндекс считает такое описание недостаточно информативным, оно может быть дополнено описанием страницы, которое составил ее владелец (тег meta description), или заменено на описание сайта из каталога. Когда сайт найден по ссылкам, в качестве описания приводятся тексты ссылок.
Пример:
По запросу поисковая система главная страница Яндекса в результатах имеет описание:
текст ссылок: Яндекс поисковая система по русскому интернету... поисковая система Yandex поисковый сервер для русского интернета...
Это значит, что на странице yandex.ru нет фразы поисковая система, но на эту страницу так часто ссылаются.
Статус документа
Под описанием документа выдается информация о нем:
• адрес страницы сайта, наиболее соответствующей запросу;
• размер страницы;
• дата последнего изменения страницы, если сервер ее выдает;
• мера соответствия страницы запросу. Возможны три варианта:
o отсутствие статуса означает, что все слова запроса есть в тексте страницы;
o «нестрогое соответствие» появляется, когда Яндекс считает страницу недостаточно подходящей для ответа на запрос, но так как общее число найденных документов невелико, он предлагает рассмотреть и такой вариант;
o «найден по ссылке» говорит, что страница обнаружена по ссылкам и будет интересна вам, несмотря на то, что она не содержит слов запроса.
Каждый из элементов описания может быть спрятан.
Тема сайта
Если найденная страница расположена на сайте, зарегистрированном в каталоге Яндекса, то под описанием документа отображается рубрика каталога, которой он принадлежит. Перейдя по этой ссылке, вы попадете в соответствующий раздел каталога.
Похожие документы
Ссылка «Похожие документы» позволяет найти страницы, которые похожи на выбранную вами и могут отвечать на запрос столь же хорошо. Если страница-образец уже удалена с сайта, Яндекс выдаст сообщение: «Запрошенный(е) документ(ы) не найден(ы)». По умолчанию ссылка не показывается, включить ее отображением можно в настройках поиска. Вы также можете искать похожие документы в форме расширенного поиска.

Еще с сайта.
Ссылка «Еще с сайта» позволяет увидеть все документы с выбранного сайта, соответствующие запросу. Вы также можете задать ограничения по сайту в форме расширенного поиска.

Эпилог результатов поиска
Другие страницы с результатами поиска
Если вам недостаточно первых десяти ссылок (или более) на первой странице результатов, вы можете просмотреть другие страницы. Ссылки «предыдущая» и «следующая» — переход на страницу, предшествующую или следующую за текущей. Ряд чисел, оформленных в виде ссылок, позволяет перейти сразу на нужную страницу результатов поиска. Многоточие в конце списка страниц - переход на страницу, следующую за перечисленными в списке.
Сортировка результатов
Вы можете отсортировать найденные страницы одним из двух способов:
• по степени их соответствия запросу (релевантности);
• по дате последнего изменения документа.
По умолчанию сортировка идет по релевантности, а сортировка по дате нужна, как правило, только когда вы ищете максимально свежие документы.
Регионы найденных сайтов
Каждый раз, получая ваш запрос, Яндекс определяет, к каким регионам относятся найденные сайты. Нажав на одну из ссылок с названием нужного региона, вы отберете только те сайты, которые к нему относятся.
Темы найденных сайтов
Яндекс показывает темы (названия рубрик каталога), к которым относится большая часть сайтов, найденных по запросу. Жирным шрифтом выделены рубрики верхнего уровня, в скобках приведены подрубрики. Нажав на одну из ссылок, вы отберете только те сайты, которые относятся к заданной теме.
Пример:
Вы хотите найти информацию об эфирных и косметических маслах (а не моторных маслах). Задав запрос масло, выберите дальше рубрику «Народная и нетрадиционная медицина».
Как выбор темы сайтов, так и выбор региона заметно сужают область поиска, поэтому их эффективно применять для запросов, которые принесли слишком много результатов.
Другие поисковые системы
Если ответ Яндекса на ваш запрос оказался недостаточно точным, попробуйте сформулировать запрос иначе, либо задайте его другим поисковым системам. Достаточно нажать на ссылку с именем поисковика, и в новом окне откроются его результаты поиска.

Выводы.
Теперь подытожим все вышесказанное.
• Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.
• Основные характеристики поисковых систем:
1. Полнота
2. Точность
3. Актуальность
4. Скорость поиска
5. Наглядность
• Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.
• В состав поисковой системы входят компоненты:
1. Модуль индексирования
2. База данных
3. Поисковый сервер
Надеемся, наш мастер-класс позволит Вам поближе ознакомиться с понятием поисковых систем, лучше узнать основные функции, характеристики и принцип работы поисковиков.
информация отправляется на машины с "быстрой базой" (6.1 - 6.2).
На текущий момент в поиск включено 77 backend'ов. Они сгруппированы по 11 машин, и каждая группа содержит копию одной из частей поискового индекса. Таким образом, информация о сайтах, условно входящих в красный сектор Интернета, находится на backend'ах первой группы (5.1.1 - 5.1.11 на рис), оранжевый сектор - на backend'ах второй группы (5.2.1 - 5.2.11) и т.д. Proxy-сервер выбирает наименее загруженный backend в каждой группе машин и отправляет на него поисковый запрос с результатами ссылочного поиска. На backend'ах осуществляется поиск по частям индексной базы и ранжирование с учетом результатов поиска по ссылочному индексу. При ранжировании для всех найденных документов высчитываются веса по конкретному запросу.
После того, как запрос обработан на backend'ах, информация о результатах и ранжировании отдается обратно на proxy-сервер. Туда же поступают отсортированные результаты с машин "быстрой базы". Proxy интегрирует данные, полученные с восьми машин: клеит дубли, объединяет зеркала сайтов, переранжирует документы в общий список по весам, рассчитанным на backend'ах. Так, первым в списке найденного может быть документ с машины 5.3.1, вторым и третьим - с 6.1, четвертым - с 5.5.2 и т.д. На proxy-сервере также реализуется построение цитат к документам и подсветка слов запроса в тексте. Полученные результаты отдаются на frontend.
Помимо информации с proxy-сервера, frontend получает результаты из поиска по товарам и из базы Тор 100, отсортированные, с цитатами и подсветкой слов запроса. Frontend осуществляет окончательное объединение результатов, генерирует html со списком найденного, вставляет баннеры и перевязки (ссылки на различные разделы Рамблера) и отдает html Cisco, который маршрутизирует информацию пользователю.
При написании мастер-класса были использованы материалы и данные ООО «Рамблер Интернет Холдинг», RuSeo.info

Заключение.
Теперь подытожим все вышесказанное.
• Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.
• Основные характеристики поисковых систем:
1. Полнота
2. Точность
3. Актуальность
4. Скорость поиска
5. Наглядность
• Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.
• В состав поисковой системы входят компоненты:
1. Модуль индексирования
2. База данных
3. Поисковый сервер
Надеемся, наш мастер-класс позволит Вам поближе ознакомиться с понятием поисковых систем, лучше узнать основные функции, характеристики и принцип работы поисковиков.

 

 

 

 

 


Список литературы:
1. Е. Колмановская, CompTek International, Яndex: система русского поиска Internet/Intranet.
2. Абросимов А.Г., Абрамов Н.В., Мотовилов Н.В., Корпоративные экономические информационные системы, уч. пос. СГЭА, 2005.
3. Информационно-поисковые системы. – http://www.comptek.ru/yandex/yand_about.html.
4. Аликберов А. Поисковые машины. – http://citforum.ru/win/internet/search/index.shtml.
5. Талантов М. Поиск информации в Интернете: подводные камни // КомпьютерПресс.– № 9, 1999.
6. Троян Г.М. Поиск в русскоязычной части Интернет: поиск

12345
скачать работу

Поисковые системы

 

Отправка СМС бесплатно

На правах рекламы


ZERO.kz
 
Модератор сайта RESURS.KZ