Информационный поиск в интернет пространстве. Характеристики поисковой системы

1. Указание адреса страницы . Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа.

ДЛЯ ПОИСКА НУЖНОЙ ИНФОРМАЦИИ В СЕТИ ИСПОЛЬЗУЕТСЯ АДРЕС Унифицированный указатель ресурса (URL-адрес, англ. Uniform Resource Locator), содержащий имя протокола по которому нужно обращаться к требуемой информации, адрес сервера и имя файла на этом сервере, например:

http://www.kazan.ru

(иерархическая структура - справа налево http - протакол гипертекста, www - узел находится в Web прстранстве).

Части адреса :

Ru - Россия (может быть и трехбуквенный)

Kazan - ресурс Казани,

Www - Интернет-ресурс, Web Site (веб-страница), сайт содержит гиперссылки, позволяющие перемещаться в потоке информации по принципу матрешки. Программа браузер позволяет не заблудиться (Home Page-главная страница).

Http - протокол передачи гипертекста.

Что касается протоколов, в Интернете используются несколько типов протоколов, появлявшихся с течением времени и развитием компьютерных технологий. К ним относятся текстовый протокол telnet, файловый протокол ftp, протокол телеконференций usenet, протокол баз данных wais, протокол gopher и др.

2. Обращение к поисковому серверу (поисковой системе). Использование поисковых серверов наиболее удобный способ поиска информации.

В настоящее время в русскоязычной части Интернета популярны следующиепоисковые серверы:

Пример поисковых систем :

Www.rambler.ru

Www.goo-gle.ru

Поисковая система находит адрес сайта по ключевым словам, даже по словосочетаниям.

Существуют и другие поисковые системы. Например, эффективная система поиска реализована на сервере почтовой службы mail.ru.

Язык запросов поисковой системы

Группа ключевых слов, сформированная по определен-ным правилам — с помощью языка запросов, называется запросом к поисковому серверу. Языки запросов к разным поисковым серверам очень похожи. Подробнее об этом мож-но узнать, посетив раздел «Помощь» нужного поискового сервера. Рассмотрим правила формирования запросов на примере поисковой системы Yandех.

Синтаксис оператора Что означает оператор Пример запроса
пробел или & Логическое И (в пределах предложения) лечебная физкультура
&& Логическое И (в пределах документа) рецепты && (плавле-ный сыр)
I Логическое ИЛИ фото | фотография | сни-мок | фотоизображение
+ Обязательное наличие слова в найденном документе +быть или +не быть
() Группирование слов (технология \изготовление) (сыра\ творога)
~ Бинарный оператор И НЕ (в пределах предложения) банки ~ закон
~~ или ___ Бинарный оператор И НЕ (в пределах документа) путеводитель по Пари-жу ~~ (агентство | тур)
/(n m) Расстояние в словах (минус (-) — назад, плюс (+) — вперед) поставщики /2 кофе музыкальное /(-2 4) об-разование вакансии - /+1 студен-тов
“ ” Поиск фразы "красная шапочка" Эквивалентно: красная /+1 шапочка
&&/(n m) Расстояние в предложениях (минус (-) — назад, плюс (+) — вперед) банк && /1 налоги

Чтобы получить лучшие результаты поиска, необходимо запомнить несколько простых правил:


Не искать информацию только по одному ключевому слову.

Лучше не вводить ключевые слова с прописной буквы, так как это может привести к тому, что не будут найдены те же слова, написанные со строчной буквы.

Если в итоге поиска вы не получили никаких результатов, проверьте, нет ли в ключевых словах орфографических ошибок.

Современные поисковые системы предоставляют воз-можность подключения к сформированному запросу се-мантического анализатора. С его помощью можно, введя какое-либо слово, выбрать документы, в которых встреча-ются производные от этого слова в различных падежах, временах и пр.

Наиболее доступным и удобным способом поиска информации во Всемирной паутине является использование поисковых систем. При этом поиск информации можно осущест-влять по каталогам, а также по набору ключевых слов, характеризующих отыскиваемый текстовый документ.

Рассмотрим использование поисковых серверов более по-дробно. Поисковый сервер содержит большое количество ссылок на самые различные документы, и все эти ссылки си-стематизированы в тематические каталоги. Например: спорт, кино, автомобили, игры, наука и др. Причем эти ссылки устанавливаются сервером самостоятельно, в автома-тическом режиме путем регулярного просмотра всех появля-ющихся во Всемирной паутине Web-страниц.

Кроме того, по-исковые серверы предоставляют пользователю возможность поиска информации по ключевым словам. После ввода клю-чевых слов поисковый сервер начинает просматривать доку-менты на других Web-серверах и выводить на экран ссылки на те документы, в которых встретились указанные слова. Обычно результаты поиска сортируются по убыванию специ-ального рейтинга документов, который показывает, насколь-ко полно заданный документ отвечает условиям поиска или насколько часто он запрашивается в сети.

Некоторые важные адреса:

www.kros.ru - Казанская региональная образовательная сеть,

www.edu.ru - сайт Министерства образования России,

www.fio.ru - федерация Интернет образования.

3. Передвижение по гиперссылкам . Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу. Если текущий документ посвящен, например музыке, то, используя гиперссылки этого документа, вряд ли можно будет попасть на сайт, посвящены спорту

Есть такой тип людей, которые просто обожают употреблять большое количество красивых метафор. Вот такие люди сравнивают всемирную сеть со свалкой. Будто бы в сети все свалено в большую кучу и черт там может сломать ногу. Будто бы в сети есть все, но чтобы что-то найти, приходится перекопать огромные горы мусора.

Ну что ж, красивая метафора. Только это не означает, что она верна. Вот у многих людей на столе, на первый взгляд, навалено огромное количество бесполезных вещей. Но для тех людей, которые за этими столами работают, расположение вещей поддается вполне определенной логике. Те вещи, которые необходимы наиболее часто, как, например, чайная кружка, лежат на расстоянии вытянутой руки. А те вещи, которые необходимы не всегда, расположены дальше. И это никак нельзя назвать свалкой или беспорядком.

В Интернете также есть своя логика. Если вы будете знать несколько правил и использовать их при поиске, то любая информация из Интернета будет, как кружка для чая, находиться на расстоянии вытянутой руки, и ощущение, что Сеть - это свалка, сразу же исчезнет.

В этой статье мы поговорим о поисковых системах и правилах поиска в Интернете.

УСТРОЙСТВО ПОИСКОВОЙ СИСТЕМЫ

Для начала - маленькое лирическое отступление об устройстве поисковой системы. Так устроено, что пользователь видит только лишь интерфейс самой системы, то есть строку поиска, а все, что находится внутри системы, так там и остается.

Первая составляющая поисковой системы - это так называемый "паук", поисковый робот. Каковы его функции? Он странствует по всей Сети, просматривая интернет - страницы, посещая ссылки. И все это он делает без остановок. Странствует паук не для собственного удовольствия. Он заносит в индекс поисковой системы абсолютно все страницы, которые просмотрел. Заносит их в виде значащих слов, которые встречаются на странице.

Таким образом, получается, что индекс, вторая составляющая поисковой машины, представляет собой огромнейшую базу данных, при помощи которой есть возможность быстро узнать, на каких страницах в Сети встречается слово поиска. Информация для справки - весь объем индекса известной всем поисковой системы Yandex составляет более восьмидесяти гигабайт.

Третья составляющая после индекса - собственно сама поисковая машина. Ее назначение - поиск нужных слов или фраз в индексе. Запомните, что поисковая система не занимается поиском во всем интернете - это не так. Только представьте, что это действительно так: например, весь объем проиндексированной информации на Yandex составляет 269 гигабайт. И если бы не было индекса после ввода вашего запроса, системе бы пришлось загрузить и просмотреть 260 гигабайт информации. Это нереально. Только подумайте, сколько времени уйдет на обработку одного единственного запроса.

Следуя из того, что поиск осуществляется не во всей Сети, а по индексу, напрашиваются два вывода. Во-первых, если поисковая система не нашла какой-то информации, это вовсе не означает, что этой информации в Сети нет, ее нет в индексе конкретно этого поисковика. Во-вторых, системы поиска информации в сети отличаются друг от друга не только интерфейсом, но и, к примеру, индексом и методами его составления. Следовательно, если вы не нашли нужной вам информации в одной поисковой системе, необходимо поискать ее в другой.

Поисковый робот, который составляет индекс, обходит все сайты по кругу и очень регулярно - таким образом, индекс всегда правильно показывает изменения, которые произошли на сайте. Сайты, которые только появились "паук" может найти самостоятельно, попав на них по ссылке с других сайтов. Также авторы сайтов могут дать знать о своем сайте "пауку".

Последняя составляющая поисковой системы - ее World Wide Web-сервер, который является лицом системы. Это интерфейс, при помощи которого пользователи делают запросы и получают на них ответы. World Wide Web-сервер - это лишь одна из частей системы, причем не самая крупная.

ЯЗЫК ПОИСКОВЫХ ЗАПРОСОВ

Для того, чтобы общаться с поисковыми системами, существуют специальный язык и специальные правила. Конечно, было бы просто великолепно, если бы на ваш вопрос сразу же выдавался исчерпывающий ответ. Но сейчас над этим только ведутся работы.

Для начала необходимо выделить ключевые слова. Надо решить, какие несколько слов более полно охарактеризуют то, что вы ищете и вводить именно эти слова. Вы скажете, что это очевидно. Да, это так. Но вы удивитесь, узнав, что многие люди вводят в строку поиска.

На Yandex есть хорошая вещь, называемая "прямой эфир" . Это страница, на которой можно увидеть 20 последних запрашиваемых фраз или слов. Понаблюдайте за этой страницей подольше, и вы испытаете множество разных чувств. Некоторые запросы можно заносить в отдельную книгу - настолько они поразительны. Глядя на некоторые запросы, вы поймете, что так искать точно НЕ надо.

Обычно, огромный процент запросов не несет в себе никакой ясности: "видео", "тв", "скачать" и так далее. Запрашивающие думают, что система сама должна догадываться, что же пользователи от нее хотят. Формируйте поисковый запрос четче, и чем конкретнее он будет, тем меньше ненужных результатов выдаст поисковик.

Некоторые поисковые системы различают одинаковые запросы, но начинающиеся с большой или маленькой буквы. Например, Яндекс выдаст разное количество результатов поиска, а система Google регистр игнорирует.

Используя знаки "+" и "-", можно либо исключать слова из поиска, либо делать их обязательными. При этом между знаком и словом не должно быть пробела. Это правило действует во всех поисковых системах.

В этом запросе мы ищем с вами интернет-магазины компьютерной техники, не специализирующиеся на ноутбуках, а в следующем, наоборот, те магазины, которые эти самые ноутбуки продают.

Как видите, поисковая система действительно выдала разные результаты.

Если в вашем запросе несколько слов просто разделены пробелами, то поисковая система будет искать те страницы, на которых эти слова входят в состав одного предложения. Ну а если вы хотите найти документ, в котором содержится любое слово из перечисленных вами в запросе, необходимо использовать знак "|".

Яндекс выдал просто чудовищное количество результатов, а все по тому, что теперь мы ищем не конкретное словосочетание, а все результаты содержащие любое из этих популярных слов. Вообще такой запрос наиболее удобно делать, если есть много слов синонимов.

Если вы хотите найти устойчивые словосочетания, то вводите их в кавычках. Это можно применить, если вы, например, ищите строчки из каких-нибудь литературных произведений или цитаты.

Как видите, конкретизировав запрос и дав задание поисковику искать конкретно это предложение, мы получили уже заметно меньшее количество результатов.

ЗАКЛЮЧЕНИЕ

Используя все вышеперечисленные методы, вы без труда найдете нужную вам информацию. Благо, поисковых систем хватает. Однако, существует огромное количество задач, выполнить которые поисковые системы не в силах.

Представим следующую ситуацию: вам срочно требуется лучший в городе системный администратор. Как вы будете его искать? Например, вы можете дать объявление в газету, а потом несколько месяцев отвечать на множество телефонных звонков. А можете прийти в специализированное агентство и достаточно быстро найти там подходящую кандидатуру.

Точно так же и с поисковыми системами - они рассчитаны на охват как можно большего количества информации. Если же вам нужно найти что-то особенное, тут есть смысл использовать специализированные поисковые системы, которые ищут по различным областям.

В заключении хотелось бы дать один совет. В рамках этой статьи мы дали вам лишь обобщенную информацию по составлению поисковых запросов. На самом же деле каждая поисковая система имеет свой расширенный язык запросов. Не поленитесь изучить возможности синтаксиса запросов своей любимой поисковой системы. В будущем это значительно упростит поиск необходимых материалов. В помощь вам ссылки на справочные материалы двух самых популярных поисковиков:

Общие сведения.

В настоящее время Интернет объединяет сотни миллионов серверов, на которых размещены миллиарды различных сайтов и отдельных файлов, содержащих различного рода информацию. Это гигантское хранилище информации. Существуют различные приемы поиска информации в Интернет.

Поиск по известному адресу. Необходимые адреса берутся из справочников. Зная адрес, достаточно ввести его в адресную строку Браузера.

www.gov.ru - сервер органов государственной власти России.

Конструирование адреса пользователем. Зная систему формирования адреса в Интернет, можно при поискеWeb-сайтов конструировать адреса.

К ключевому слову (названию фирмы, предприятия, организации или простому английскому существительному) необходимо добавить домен тематический или географический, при этом необходимо подключать интуицию.

Адреса коммерческих Web-страниц:

www.cnn.com (всемирные новости CNN),

www.sony.com (фирма SONY),

www.mtv.com (музыкальные новости MTV).

Адреса учебных заведений:

www.ntu.edu (Национальный университет США).

Адреса региональных серверов:

www.poland.net (Польша),

www.israil.net (Израиль).

Поисковые системы Интернет

Для поиска информации в Интернет разработаны специальные информационно-поисковые системы. Поисковые системы имеют обычный адрес и отображаются в виде Web-страницы, содержащей специальные средства для организации поиска (строку для поиска, тематический каталог, ссылки). Для вызова поисковой системы достаточно ввести ее адрес в адресную строку Браузера.

По способу организации информации информационно-поисковые системы делятся на два вида: классификационные (рубрикаторы) и словарные.

Рубрикаторы (классификаторы) - поисковые системы, в которых используется иерархическая (древовидная) организация информации. При поиске информации пользователь просматривает тематические рубрики, постепенно сужая поле поиска (например, если необходимо найти значение какого-то слова, то сначала в классификаторе нужно найти словарь, а затем уже в нем найти нужное слово).

Словарные поисковые системы - это мощные автоматические программно-аппаратные комплексы. С их помощью просматривается (сканируется) информация в Интернет. В специальные справочники-индексы заносятся данные о местонахождении той или иной информации. В ответ на запрос осуществляется поиск в соответствии со строкой запроса. В результате пользователю предлагаются те адреса (URL), на которых в момент сканирования найдены искомые слово или группа слов. Выбрав любой из предложенных адресов-ссылок, можно перейти к найденному документу. Большинство современных поисковых систем являются смешанными.

Наиболее известные и популярные системы поиска:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Существуют системы, специализирующиеся на поиске информационных ресурсов по различным направлениям.

Поиск людей в Интернет:

www.whowhere.ru ww. bigfoot.com

Поиск по телеконференциям (Usenet):

www.dejanews.com

Предметные поисковые системы:

Поиск программного обеспечения:

Поиск по файловым архивам:

http://ftpseach. city.ru, http://ftpsearch. licos.com

Каталоги (тематические подборки ссылок с аннотациями):

http://www.atrus.ru

Часто эффективный поиск информации можно провести с помощью региональных каталогов - специализированных серверов, содержащих данные о предприятиях или Web-ресурсах какого-то города или региона. Например, для Санкт-Петербурга такой каталог располагается по адресу http://www.spb.ru.

Список ИПС можно найти на сайте www.monk. newmail.ru

Более подробный перечень поисковых систем и каталогов представлен в табл. 3.2.

Правила выполнения запросов

В каждой поисковой системе в разделе Помощь (Help) можно получить сведения о том, как искать, как составить строку запроса. Ниже приведена информация о типовом, "усредненном" языке запросов.

Простой запрос.

Ввести одно слово, определяющее тему поиска. Например, в поисковой системе Rambler.ru достаточно ввести: автоматика.

Находятся документы, в которых встречаются слова, указанные в запросе. Распознаются все формы слов русского языка, как правило, регистр букв игнорируется.

В запросе можно использовать символ "*" или "?". Знаком "?" в ключевом слове заменяется один символ, на место которого может быть подставлена любая буква, а знаком "*" - последовательность символов.

Например, запрос автомат* позволит найти документы, включающие слова автоматический, автоматика и т.д.

Сложный запрос.

Часто возникает необходимость комбинирования ключевых слов для получения более определенной информации. В этом случае используются дополнительные слова-связки, функции, операторы, символы, комбинации операторов, разделенные скобками.

Например, запрос музыка & (beatles | битлз) означает, что пользователь ищет документы, содержащие слова музыка и beatles или музыка и битлз.

В табл.3.1 приведены правила формирования запросов, принятые в системе Апорт (http://www.aport.ru).

Таблица 3.1

Операторы для формирования запросов

Оператор Синонимы Комментарий
И AND & По запросу будут найдены документы, содержащие оба ключевых слова. Его можно и не писать. Например, запрос: информатика и учебник эквивалентен информатика учебник
ИЛИ OR | Производится поиск тех документов, в которых используется любое из указанных слов или оба слова одновременно
НЕ NOT - ~ Поиск ограничивается документами, не содержащими слово, указанное после оператора
" " " " Двойные или одинарные кавычки позволяют находить словосочетание
Дата= дата: date= Поиск ограничивается документами, попадающими в заданный интервал дат. Пример 1. валюта дата=01/02/2002-01/03/2002. По этому запросу будут выданы документы, содержащие слово "валюта" и имеющие дату от 1 февраля 2002 г. до 1 марта 2002 г. Пример 2. date=01/03/2002 валюта Пример 3. дата: <02/03/2002 валюта

Таблица 3.2

Список поисковых серверов и каталогов

Адрес Описание
www.excite.com Поисковый сервер с обзорами узлов и путеводителями
www.alta-vista.com Поисковый сервер, имеются возможности расширенного поиска
www.hotbot.com Поисковый сервер
www.poland.net www.israil.net Региональные поисковые серверы Польши, Израиля
www.ifoseek.com Поисковый сервер (простой в использовании)
www.ipl.org Internet Publik library, публичная библиотека, функционирующая в рамках проекта "Всемирная деревня"
www.wisewire.com WiseWire - организация поиска с применением искусственного интеллекта
www.webcrawler.com WebCrawler - поисковый сервер, прост в обращении
www.yahoo.com КаталогWeb и интерфейс для обращения к полнотекстовому поиску на сервере AltaVista
www.aport.ru Апорт - русскоязычный поисковый сервер
www.yandex.ru Яндекс - русскоязычный поисковый сервер
www.rambler.ru Рамблер - русскоязычный поисковый сервер
Справочные ресурсы Интернет
www.yellow.com Желтые страницы Интернет
monk. newmail.ru Поисковые системы различного профиля
www.top200.ru 200 лучшихWeb-сайтов
www.allru.net
www.ru Каталог русских ресурсов Интернет
www.allru.net/z09. htm Образовательные ресурсы
www.students.ru Сервер российского студенчества
www.cdo.ru/index_new. asp Центр дистанционного обучения
www.open. ac. uk Открытый университет Великобритании
www.ntu.edu Национальный университет США
www.translate.ru Электронный переводчик текстов
www.pomorsu.ru/guide. library.html Список ссылок на сетевые библиотеки
www.elibrary.ru Научная электронная библиотека
www.citforum.ru Электронная библиотека
www.infamed.com/psy Психологические тесты
www.pokoleniye.ru Web-сайт Федерации Интернет образования
www.metod. narod.ru Образовательные ресурсы
www.spb. osi.ru/ic/distant Дистанционное обучение в Интернет
www.examen.ru Экзамены и тесты
www.kbsu.ru/~book/ Учебник информатики
Mega. km.ru Энциклопедии и словари

Поиск информации в Интернете: подводные камни

Проблемы, не лежащие на поверхности, нередко дают о себе знать лишь "задним числом", после того как определенный этап поисковых работ завершен и, возможно, исходя из его результатов уже принято какое-либо решение. Что же мешает сделать ситуацию прозрачной с самого начала эксплуатации той или иной информационно-поисковой системы (ИПС)? Ответ довольно прост: отсутствие исчерпывающей информации подобного рода со стороны разработчика. Прямым следствием этого становятся недостоверность получаемых данных и их неконтролируемая потеря. Редко удается встретить в Сети поисковую систему, которая не обладала бы некоторыми "недокументированными" особенностями. Казалось бы - пользователю необходимо не так уж много сведений, а именно:

как происходит наполнение базы данных ИПС и каков ее объем;

полный спектр возможностей поискового языка системы;

основные особенности представления результатов поиска, прежде всего алгоритма ранжирования записей из списка отклика на поисковый запрос.

Увы, источником подобной информации обычно является не документ, доступный с головной страницы поискового сервера, а разбросанные по Сети, книгам и компьютерным журналам публикации отдельных авторов. К причинам такого положения дел, по-видимому, можно отнести не только небрежность разработчика, но и фактор, именуемый маркетинговой политикой. Проще говоря, предоставление поисковой системой наиболее полной информации о самой себе не всегда положительно сказывается на ее рейтинге. Тем не менее, взять ситуацию под контроль в ряде случаев пользователю оказывается вполне по силам. Выяснить особенности работы избранного поискового сервиса часто удается с помощью тестирования. Построение специальных тестовых запросов, быстро проясняющих именно тот аспект работы системы, который наиболее важен для текущей задачи, во многих случаях оказывается нетривиальным. Тому, как избежать некоторых неприятностей при работе с ИПС, мы и посвятим наше обсуждение. В качестве примеров, иллюстрирующих изложение, будут рассмотрены широко известные поисковые системы Интернета.

Поиск информации в Интернете

Поиск информации в Интернете

Для поиска информации в обычно используются три способа (См. Рис.1). Первый из них - поиск по адресу. Он применяется, когда пользователю известен адрес информационного ресурса, содержащего необходимую ему информацию. При организации поиска информации по адресу (форма адреса - IP, доменный или URL - в этом случае значения не имеет) пользователю достаточно просто ввести адрес ресурса в соответствующее поле браузера - программы, предназначенной для обеспечения доступа к сетевым ресурсам.

Рис. 1. Способы поиска информации в гипертекстовых базах данных

Второй - поиск с помощью навигации по гиперсвязям. При использовании этого вида поиска случае пользователь сначала должен получить доступ к серверу, связанному с соответствующей БД. После этого можно найти документ, используя гиперссылки. Очевидно, что этот способ удобен, когда адрес ресурса неизвестен пользователю. Для использования в качестве исходной точки для поиска при реализации этого способа предназначены Web-порталы - серверы, предоставляющие прямой доступ к некоторому множеству серверов, включая установленные на них информационные ресурсы, а также Web-приложения, которые реализуют Web-сервисы, соответствующие назначению портала. Доступные через портал серверы могут относиться к определенной системе (например - корпоративной) или различным системам и быть специально подобраны по видовому, тематическому или другим признакам документов и данных, содержащихся на их сайтах. Обычно порталы совмещают в себе разнообразные функции с целью удержать клиента как можно дольше. Доминирующим сервисом портала является сервис справочной службы: поиск, рубрикаторы, финансовые индексы, информация о погоде и т.д. Если Web-сайты в большинстве случаев представляют собой наборы статических Web-страниц, то порталы являются совокупностями программных средств и заранее неструктурированной информации, которую эти средства превращают в структурированные данные по запросу конкретных пользователей.

Третий способ поиска предполагает использование поисковых серверов Интернета. Поисковыми серверами называют выделенные хост - компьютеры, в которых размещаются базы данных ресурсов Интернета. Пользовательский интерфейс такого сервера имеет поле для ввода ключевых слов, описывающих тему, интересующую пользователя (См. Рис. 2).

Рис.2. Вид окна поискового сервера системы Яндекс

Эти слова сервер воспринимает как информационный запрос, в соответствии с которым он осуществляет поиск ресурсов и представляет список найденных документов пользователю. Очевидно, что при реализации этого способа возможны ошибки как 1-го (пропуск цели), так и 2-го рода (информационный шум). Следует упомянуть, что различаются две группы поисковых серверов: поисковые машины и предметные каталоги. Их отличие обусловлено способом создания и последующего пополнения базы данных ресурсов Интернета, которой данный сервер осуществляет информационный поиск. Так, поисковые машины имеют в своем составе специальную программу - поисковый робот. Она осуществляет постоянный мониторинг сети, собирает информацию с Web- страниц, индексирует их и фиксирует их поисковый образ в своей базе данных. В предметных каталогах база данных о документах Интернета формируется «вручную» специалистами-редакторами. Поскольку в Интернете отсутствует единое администрирование, постольку его информационные ресурсы постоянно меняются. В нём могут появляться новые и исчезать существующие документы. Частота обновления информации в документах для разных сайтов различна: для некоторых — это несколько раз в час, для некоторых — раз в сутки, день, месяц и т.д. Поэтому очень важно понимать, что при использовании информационно-поисковых систем для нахождения информации в Интернете, поиск осуществляется не на реальном пространстве документов Сети, а в некоторой модели, содержание которой может значительно отличаться от действительного содержания Интернет в момент проведения поиска. По степени охвата индексируемых ресурсов поисковые системы можно разделить на две группы: международные и русскоязычные. Первые индексируют все опубликованные в Интернете документы подряд. Вторые индексируют ресурсы, расположенные в доменных зонах с преобладанием русского языка. Список наиболее популярных систем приведен в Табл. 1.

Табл. 1. Наиболее популярные поисковые системы

Международные Русскоязычные
Google Яндекс (44,4 % Рунета)
Yahoo! Rambler (10,6 % Рунета)
Bing Mail.ru (7,3 % Рунета)
MSN Nigma (0,5 % Рунета)
AltaVista Gogo.ru (0,3 % Рунета)
Ask Aport (0,2 % Рунета)

Примечание: Рунет - это русскоязычная часть Интернета, составляющая домены с именами ru и рф .

Необходимо упомянуть, что существует особая категория поисковых серверов - метапоисковые системы. Их принципиальное отличие от поисковых машин и предметных каталогов состоит в том, что у них отсутствует собственная индексная база данных, и поэтому они, получив запрос пользователя, перенаправляют его сразу к нескольким поисковым серверам (См. Рис. 3).

Рис. 3. Схема работы метапоисковой системы

Возможность одновременного использования нескольких поисковых серверов по одному запросу является очевидным преимуществом метапоисковых систем. В настоящее широкое применение время нашла система Metabot.ru, интерфейс которой представлен на Рис. 4. Эта система позволяет использовать для поиска ресурсов как международные, так и русскоязычные поисковые серверы.

Эффективный поиск информации с использованием компьютера – актуальная задача, возникающая не только перед начинающими, но и бывалыми пользователями сети интернет, ведь кто владеет данными – тот владеет миром, как гласит всем хорошо известная поговорка. Сегодня мы разберем способы быстрого поиска необходимой и важной информации в русскоязычном интернете . На данный момент их выделяют всего три вида:

  • Поиск информации по прямой ссылке в сети
  • Поиск с помощью интернет серфинга
  • Правила поиска информации в сети интернет
  1. через указание прямого адреса сайта, где размещены нужные данные и необходимая информация;
  2. серфинг по ссылкам с помощью персонального компьютера в сети интернет;
  3. с помощью поисковых систем (машин) в интернет.

Рассмотрим более развернуто все способы поиска актуальной информации в сети с помощью компьютера.

Поиск информации по прямой ссылке в сети

Если вы уже знаете, по какому адресу в интернете размещена нужная вам информация, то тогда поиск с помощью компьютера заметно облегчается: достаточно просто вбить адрес сайта в браузерную строку и ознакомиться с предложенными данными. Если перед вами открылся объемный текст на странице сайта в интернете, а вас интересует буквально несколько строчек, спрятанные в «тонне» печатных символов, то можете воспользоваться внутристраничным поиском. Для этого нажмите сочетание клавиш Ctrl и F (любой раскладки клавиатуры компьютера), а в предложенную графу «Найти» вбейте фразу или слово, которое точно содержится в абзаце с информацией, которую ищете, после чего нажмите «Enter».

В браузере подсветятся другим цветом все слова, упоминающиеся на странице и похожие на то слово, которое вы ищете. Однако довольно часто случается так, что мы не помним или вообще не знаем ссылки с местонахождением информации в интернете. В этом случае удобнее всего прибегнуть к другим двум видам поиска данных с помощью компьютера.

Поиск с помощью интернет серфинга

Интернет серфинг – поиск, при котором осуществляется последовательный переход по ссылкам с одного тематического сайта на другой до тех пор, пока не будет найден источник нужных данных. Преимущество такого способа интернет-поиска данных заключается в его увлекательности и возможности освоить большой объем информации из разных сайтов последовательно и основательно. Среди недостатков этого вида поиска находится его длительность, а также то, что на первоначальный сайт, с которого начнется ваш серфинг, тоже нужно как-то попасть. А если вы не располагаете адресом сайта, с которого начнете серфинг, то здесь вам придется прибегнуть к помощи такого способа поиска, как поисковые системы.

Способы поиска информации в сети с помощью поисковиков

Сегодня широко известны публике Рунета такие поисковые машины, как Яндекс.ru, Rambler.ru, Google.ru. Эти сайты позволяют искать данные по вводимому запросу на всех сайтах интернета. По принципу работы поисковые системы бывают двух видов: поисковые индексы и поисковые каталоги:

  • Поисковые каталоги. Эти сайты оказывают помощь в поиске данных определенной тематики в сети интернет: информация в таких каталогах четко структурирована по группам и темам, что способствует быстрому нахождению результата. В каждой теме пользователю предлагается ряд ссылок на сайты, где можно найти интересующие его знания.
  • Поисковые индексы. Это сайты-указатели, в которых при введении ключевого слова в строку поиска, пользователь получает ряд ссылок на страницы в интернете, где содержится запрашиваемое слово или фраза. Поисковые индексы осуществляют поиск с помощью специальных программ, называемых «пауками», сканирующих страницы сайтов в интернете на предмет их тематики. После такого скана поисковик заносит их в свою базу, из которой позже и «достается» информация при вводе пользователем запроса в поисковую сроку.

Правила поиска информации в сети интернет

Сейчас рассмотрим основные, но важные правила эффективного поиска актуальной информации в русскоязычной сети интернет с помощью компьютера.

  1. Формируйте правильную ключевую фразу для обращения к поисковой системе. Нельзя использовать только одно слово для поиска, если вы хотите получить действительно полезный результат, а также не стоит вводить и слишком большие фразы. Оптимальный размер поискового запроса составляет от 2 до 4 слов. Если в результатах поиска поисковиком найдено слишком мало результатов, то стоит попробовать переформулировать введенную фразу, заменив некоторые слова синонимами, а также проверить наличие орфографических ошибок в словах. Запомните: нет такой информации, которой нет в интернете. Просто подбирайте правильные слова, соблюдайте правила и вы найдете то, что ищете.
  2. Применяйте специальные операторы. Современный эффективный и быстрый поиск любой необходимой информации посредством поисковика и с помощью персонального компьютера подразумевает знание и применение некоторых хитростей, которыми являются сокращения и специальные символы-операторы. Операторы – значки, используемые при формировании запроса в поисковой системе и облегчающие поиск необходимых данных. Рассмотрим самые распространенные операторы и их значения, которые могут пригодиться на практике.
  3. Пробел или знак & - означает, что требуется искать документы с требуемым словосочетанием в пределах одного предложения. Пример ввода в поисковую строку: вкусный рецепт или вкусный & рецепт.
  4. && - означает необходимость поиска страницы, на которой будут упомянуты отдельные слова из словосочетания в пределах всего текста, а не только одного предложения. Пример: вкусный && рецепт.
  5. | - вам будут предложены статьи, в пределах которых будет употреблено только 1 из введенных слов. Пример: брак | недостаток | дефект.
  6. + - означает поиск текста с обязательным сочетанием подряд слов, введенных между знаком «+». Пример: вкусный+рецепт.
  7. “ ” – поиск цепочки слов без ее разбивания на отдельные слова. Пример: “конфеты «Красная Поляна»”.

Соблюдая эти простые правила при поиске данных с помощью компьютера и интернета, вы облегчите себе задачу и всегда быстро сможете найти информацию, необходимую вам в любой момент времени.

Компьютер