Кто создатель всемирной паутины. Всемирная паутина. Что было прототипом Всемирной паутины

Здравствуйте, уважаемые читатели блога сайт. Все мы с вами живем в эпоху глобального интернета и пользуемся терминами сайт, веб, www (World Wide Web — всемирная паутина, глобальная сеть) довольно часто и особо не вдаваясь в то, что же это такое.

Тоже самое я наблюдаю и у других авторов, да и обычных собеседников. «Сайт», «интернет», «сеть» или аббревиатура «WWW» стали для нас настолько обычными понятиями, что даже задумываться об их сути не приходит в голову. Однако первый вебсайт появился на свет всего лишь каких-то двадцать лет назад. А что такое интернет?

Ведь он имеет довольно длинную историю, однако, до появления глобальной сети (WWW), 99.9% жителей планеты даже не подозревали о его существовании, ибо он был уделом специалистов и энтузиастов. Сейчас же о всемирной паутине знают даже эскимосы, в языке которых это слово отождествляется со способностью шаманов отыскивать ответы в слоях мироздания. Так давайте же откроем для себя — что такое интернет, сайт, всемирная паутина, и все остальное.

Что такое Интернет и его отличие от глобальной паутины WWW

Самым замечательным фактом, который сейчас можно констатировать, является то, что Internet не имеет владельца . По сути это объединение отдельных локалок (благодаря принятым когда-то общим стандартам, а именно протоколу TCP/IP), которое поддерживается в рабочем состоянии сетевыми провайдерами.

Есть мнение, что из-за все возрастающего медийного трафика (видео и другого тяжелого контента, перемещаемого тоннами в сети) вскоре случится коллапс Интернета из-за его ограниченной на текущий момент пропускной способности. Основной проблемой в этом плане является обновление сетевого оборудования, составляющего глобальную паутину, на более скоростное, что в первую очередь сдерживается необходимыми при этом дополнительными расходами. Но думаю, что проблема будет решена по мере назревания коллапса, да и уже существуют отдельные сегменты сети работающие на высоких скоростях.

Вообще, в свете тог, что интернет по сути ничей, следует упомянуть, что многие государства, пытаясь внедрить цензуру в глобальной сети, хотят отождествить ее (а именно его самую популярную на данный момент составляющую WWW) со .

Но под этим хотением на самом деле нет никакой почвы, потому что интернет это всего лишь средство коммуникации или, другими словами, носитель информации сравнимый с телефоном или даже обычной бумагой. Попробуйте применить санкции к бумаге или ее распространению по планете. Отдельные санкции отдельные государства, на самом деле, могу применять только к сайтам (островкам информации в сети), которые становятся доступны пользователям посредством всемирной паутины.

Первые предпосылки создания глобальной паутины и интернета были предприняты... Как вы думаете в каком году? Удивительно, но аж в дремучем 1957. Понадобилась такая сетка, естественно, военным (и, естественно, США, ну куда же без них) для связи в случае развертывания военных действий с применением ядреного оружия. Создавали сеть довольно долго (около 12 лет), но это вполне объяснимо тем, что в то время компьютеры находились в зачаточном состоянии.

Но тем не менее их мощности вполне хватало на то, чтобы к 1971 году получить возможность между военными ведомствами и ведущими университетами США. Таким образом протокол передачи Емайл стал первым способом использования интернета для нужд пользователей. Еще через пару о том, что такое интернет уже узнали за океаном. К началу 80x были стандартизированы основные протоколы передачи данных (почтовый, ), а так же появился протокол так называемых новостных конференций Usenet, который был похож на почтовый, но позволял организовывать что-то похожее на форумы.

А спустя еще несколько лет появилась идея создания системы доменных имен (DNS — сыграет важнейшую роль в становлении WWW) и появился первый в мире протокол для общения через интернет в реальном времени — IRC (в русском разговорном — ирка). Он позволял чатиться в сети. Фантастика, которая была доступна и интересна очень и очень малому числу жителей планеты Земля. Но это только пока.

На стыке 80x и 90x годов происходят настолько значимые события в истории развития инфраструктуры, что они, собственно, и предопределили ее дальнейшую судьбу. Вообще такое распространение глобальной сети в умах современных жителей планеты обязано практически одному единственному человеку — Тиму Бернерсу-Ли :

Бернерс-Ли является англичанином, родившимся в семье двух математиков, посвятивших свою жизнь созданию одного из первых компьютеров в мире. Именно благодаря ему мир узнал, что такое интернет, сайт, электронная почта и т.п. Изначально всемирную паутину WWW (World Wide Web) он создал для нужд ядерных исследований Церн (тот самый коллайдер находится у них). Задача состояла в удобном размещении всей имеющейся у концерна научной информации в их собственной сети.

Для решения этой задачи он придумал все, что сейчас является основополагающими элементами WWW (то, что мы и считаем интернетом, немного не понимая его суть). За основу он взял принцип организации информации, называемый . Что это такое? Данный принцип был придуман задолго до этого и заключался в такой организации текста, когда линейность повествования заменялась возможностью перехода по разным ссылкам (связям).

Интернет — это гипертекст, гиперссылки, Урлы и железо

Благодаря этому гипертекст можно читать в разной последовательности, тем самым получая различные варианты линейного текста (ну, вам это, как пользователям интернета со стажем, сейчас должно быть понятно и очевидно, но тогда это была революция). В роли узлов гипертекста должны были , которые мы сейчас называем просто ссылками.

В результате, всю существующую сейчас в компьютерах информацию можно представить как один большой гипертекст, включающий в себя бесчисленное множество узлов (гиперссылок). Все, что было разработано Тимом Бернерсом-Ли, было перенесено с локальной сетки ЦЕРНа в то, что мы сегодня называем интернетом, после чего Web (веб) стал бешеными темпами набирать популярность (первые пятьдесят миллионов пользователей World Wide Web были зарегистрированы всего лишь на протяжении первых пяти лет существования).

Но для реализации принципа гипертекста и гиперссылок понадобилось с нуля создать и разработать сразу несколько вещей. Во-первых, нужен был новый протокол передачи данных, которым стал всем вам сейчас известный протокол HTTP (в начале адресов всех веб сайтов вы найдете упоминание о нем или о его защищенной версии HTTPs).

Во-вторых, был разработан с нуля , аббревиатура которого сейчас известна всем вебмастерам в мире. Итак, мы получили инструменты для передачи данных и создания сайтов (набора веб страниц или web документов). Но как же ссылаться на эти самые документы?

Первый позволял идентифицировать документ на отдельном сервере (сайте), а второй позволял подмешать в идентификатор URI доменное имя (полученное и однозначно указывающее на принадлежность документа вебсайту, размещенному на определенном сервере) или IP адрес (уникальный цифровой идентификатор абсолютно всех устройств в глобальной или локальной сети). Про читайте поподробнее по приведенной ссылке.

Осталось сделать всего лишь один шаг для того, чтобы всемирная паутина WWW, наконец-то, заработала и стала востребована пользователями. Знаете какой?

Ну, конечное же, нужна была программа, которая бы на компьютере пользователя могла отображать содержимое любой запрошенной в интернете (с помощью URL адреса) веб страницы. Такой программой стал . Если говорить про сегодняшнее время, то основных игроков на этом рынке не так уж и много, и обо всех из них я успел написать по небольшому обзору:

  1. (IE, MSIE) - старая гвардия еще в строю
  2. (Мазила Фаерфокс) - еще один ветеран не собирается сдавать позиций без боя
  3. (Гугл Хром) - амбициозный новичок, которому удалось захватить лидерство в максимально короткие сроки
  4. — любимый многими в рунете, но постепенно теряющий популярность браузер
  5. — засланец из яблочного стана

Тимоти Джон Бернерс-Ли самостоятельно написал программу первого в мире Internet обозревателя и назвал его, не мудрствуя лукаво, World Wide Web. Хотя это и не было пределом совершенства, однако именно с этого браузера началось победное шествие всемирной паутины WWW по планете.

Вообще, конечно же, поражает тот факт, что все необходимые инструменты для современного интернета (имеется в виду его самая популярная составляющая) были созданы всего лишь одним человеком за столь короткое время. Браво.

Чуть позже появился первый графический браузер Мозаика, от которого ведут начало и многие из современных обозревателей (Мазила и Эксплорер). Именно Мозаика стала той каплей, которой не хватало, чтобы появился интерес к интернету (а именно к всемирной паутине) у обычных жителей планеты Земля. Графический браузер — это уже совсем другое дело, чем текстовый. Все любят смотреть картинки и лишь немногие любят читать.

Что примечательно, Бернерс-Ли не получил каких-то жутко больших сумм денег, которые, например, в результате получили или , хотя сделал он для глобальной сети, наверное, все же больше.

Да, со временем в дополнение к разработанному Бернерсом-Ли языку Html добавился еще и . Благодаря этому часть операторов в Html стала не нужна, а им на замену пришли гораздо более гибкие инструменты каскадных таблиц стилей, которые позволили существенно повысить привлекательность и гибкость дизайна у создаваемых сейчас сайтов. Хотя в изучении правила CSS, кончено же, более сложны, чем язык разметки. Однако, красота требует жертв.

Как устроены интернет и глобальная сеть изнутри?

Но давайте посмотрим, что такое Web (www) и каким образом осуществляется размещение информации в Internet. Тут мы с вами вплотную столкнемся с тем самым феноменом, который называется website (web — сетка, а site — место). Итак, что же такое «место в сети» (аналог места под солнцем в реальной жизни) и как его, собственно, получить.

Что же такое интет? Итак, он состоит из невидимых и не имеющих большого значения для пользователей каналообразующих устройств (маршрутизаторов, коммутаторов). Сеть же WWW (то, что мы называем Web или всемирной паутиной) состоит из миллионов веб серверов, которые представляют из себя программы, запущенные на немного модифицированных компьютерах, которые в свою очередь обязательно должны быть подключены (в режиме 24 на 7) к глобальной паутине и использовать для обмена данными протокол HTTP.

Веб сервер (программа) получает запрос (чаще всего от браузера пользователя, который открывает ссылку или же ввел Url в адресной строке) на открытие документа, размещенного на этом самом сервере. Документ в простейшем случае представляет из себя физический файл (с расширение html, например), который лежит на жестком диске сервера.

В более сложном случае (при использовании ) запрашиваемый документ будет сформирован программным способом на лету.

Для просмотра запрошенной страницы сайта используется специальное программное обеспечение на стороне клиента (пользователя) под названием браузер, который умеет отрисовывать закачанный фрагмент гипертекста в удобоваримом виде на том устройстве отображения информации, где этот самый обозреватель установлен (ПК, телефон, планшет и т.п.). В общем-то все просто, если не вдаваться в детали.

Раньше каждый отдельный вебсайт размещался физически на отдельном компьютере. Связано это было в основном со слабой вычислительной мощностью имеющихся на тот момент ПК. Но в любом случае, компьютер с программой web сервера и размещенном на нем сайтом обязательно должен быть круглосуточно подключен в интернету. Осуществить это в домашних условиях довольно сложно и дорого, поэтому для хранения веб сайтов обычно пользуются услугами специализирующихся на этом хостинг-компаний.

Услуга хостинга в силу популярности WWW является сейчас довольно востребованной. Благодаря растущим со временем мощностям современных ПК у хостеров появилась возможность размещать помногу вебсайтов на одном физическом компьютере (виртуальный хостинг), а размещение одного сайта на одном физическом ПК стало называться услугой .

При использовании виртуального хостинга всем размещенным на компьютере (тот, который называется сервером) вебсайтам может быть присвоен один IP адрес, а можете быть и отдельный каждому. Сути это не меняет и лишь косвенно может влиять на размещенный там Website (плохое соседство на одном IP может плохо сказаться на — поисковики иногда гребут всех под одну гребенку).

Теперь давайте немного поговорим за доменные имена вебсайтов и их значение во всемирной паутине WWW. Каждый ресурс в интернете имеет свое доменное имя. Причем может сложиться ситуация, когда у одного и того же сайта может быть несколько доменных имен (в результате получаются зеркала или же алиасы), а так же, например, на для многих ресурсов может использоваться одно и то же доменное имя.

Так же для некоторых серьезных ресурсов существует такое понятие, как зеркала. В этом случае файлы сайта могут находиться на разных физических компьютерах, а сами ресурсы иметь разные доменные имена. Но это все нюансы, только запутывающие начинающих пользователей.

Что такое Всемирная паутина?

Паутина, или «веб», представляет собой набор связанных между собой страниц с определённой информацией. Каждая такая страница может содержать текст, изображения, видео, аудио и другие разнообразные объекты. Но кроме этого, на веб-страницах есть так называемые гиперссылки. Каждая такая ссылка указывает на другую страницу, которая находится на каком-то другом компьютере в сети Интернет.

Различные информационные ресурсы, которые связаны между собой средствами телекоммуникаций и основаны на гипертекстовом представлении данных, формируют Всемирную паутину (World Wide Web, или сокращённо WWW).

Гиперссылки связывают страницы, которые расположены на различных компьютерах, находящихся в разных уголках земного шара. Огромное количество компьютеров, которые объединены в одну сеть, — это и есть интернет, а «всемирная паутина» — это огромное количество веб-страниц, размещённых на компьютерах сети.

Каждая веб-страница в интернете имеет адрес — URL (англ. Uniform Resource Locator — уникальный адрес, имя). Именно по адресу можно найти любую страницу.

Как была создана Всемирная паутина?

12 марта 1989 года Тим Бернерс-Ли представил руководству ЦЕРНа проект единой системы организации, хранения и общего доступа к информации, которая должна была решить проблему обмена знаниями и опытом между сотрудниками Центра. Проблему доступа к информации на разных компьютерах сотрудников Бернерс-Ли предложил решить с помощью программ-браузеров, обеспечивающих доступ к компьютеру-серверу, где хранится гипертекстовая информация. После успешной реализации проекта Бернерс-Ли смог убедить весь остальной мир использовать единые стандарты интернет-коммуникации, используя стандарты протоколов передачи гипертекста (HTTP) и универсальный язык разметки (HTML).

Следует заметить, что Тим Бернерс-Ли не был первым создателем интернета. Первую систему протоколов, обеспечивающих передачу данных между объединёнными в сеть компьютерами, разработали сотрудники Агентства по перспективным оборонным научно-исследовательским разработкам США (DARPA) Винтон Серф и Роберт Кан в конце 60-х - начале 70-х годов прошлого века. Бернерс-Ли лишь предложил использовать возможности компьютерных сетей для создания новой системы организации информации и доступа к ней.

Что было прототипом Всемирной паутины?

Ещё в 60-х годах XX века Министерство обороны США поставило задачу разработать надёжную систему передачи информации на случай войны. Агентство передовых исследовательских проектов США (ARPA) предложило разработать для этого компьютерную сеть. Назвали её ARPANET (англ. Advanced Research Projects Agency Network). Проект объединил четыре научных учреждения — Университет Лос-Анджелеса, Стэнфордский исследовательский институт и Университеты Санта Барбары и Юты. Все работы финансировались за счёт Министерства обороны США.

Первая передача данных по компьютерной сети состоялась в 1969 году. Профессор Лос-Анджелеса университета со своими студентами попытались войти в компьютер Стэнфорда и передать слово «login». Успешно передать удалось лишь первые две буквы L и O. Когда они напечатали букву G, система связи вышла из строя, однако революция в области интернета состоялась.

К 1971 году в США была создана сеть с 23 пользователями. Была разработана первая программа для отправки электронной почты по сети. А в 1973 году к сети подсоединились Университетский колледж Лондона и Государственные службы в Норвегии, и сеть стала международной. В 1977 году число пользователей Интернета достигло 100, в 1984 — 1000, в 1986 году их было уже больше 5000, в 1989 — более 100 000. В 1991 году в ЦЕРНе был реализован проект World-Wide Web (WWW). В 1997 году насчитывалось уже 19,5 миллиона пользователей сети Интернет.

В некоторых источниках указывается дата появления Всемирной паутины на день позже — 13 марта 1989 года.

Интернет сегодня прочно вошёл в нашу жизнь. Но имя Тим Бернерс Ли мало кому знакомо. А между тем это именно тот человек, кто создал интернет – Всемирную паутину, без которой многие даже не представляют своей жизни.

Биография Тимоти довольна проста: родился он в 1955 году, в июне месяце, 8 числа. Родина его – Лондон. Родителями Тима были математики-программисты Конвэй Бернерс-Ли (отец) и Мэри Ли Вудс (мать). Оба родителя работали в одном университете (Манчестерском) над созданием электронной вычислительной машины, обладающей оперативной памятью – «Manchester Mark I».

Само собой разумеется, что маленький Тим, видя занятия взрослых, играл, сооружая из пустых коробок маленькие макеты компьютеров. Да и рисовал Тим в основном на компьютерных перфокартах – этаких картонках с дырочками, первых носителях информации.

Годы учёбы

Учился Тим Бернерс в престижной школе Эмануэл-Скул, где его увлечение конструированием и математикой, успехи в изучении, удивляли всех. Биография его имеет такую запись: «Годы учёбы в школе – 1969-1973 гг»

Однако по окончании школы в 1973 году при поступлении в Королевский колледж при Оксфордском университете Тим Бернерс принял решение стать физиком.

И вот тут снова проснулась детская тяга к компьютерам у Тима Бернерса-Ли – в биографии будущего первооткрывателя интернета появляется интересный факт. Взяв процессор Motorola M6800 и обычный телевизор, Тим умудрился спаять из них свой первый компьютер.

Как биография любого озорного мальчишки, биография Тимоти Джон Бернерс-Ли имеет увлекательные страницы, раскрывающие личность с не совсем приглядной стороны. Собственно, осуждать юношу за взлом базы данных университетского компьютера было опрометчиво – это являлось всего лишь фактом любознательности и проверки своих сил. Но в результате Тим получил строгое предупреждение от ректора и запрет на пользование компьютером в университете.

Работа


В 1976 году Тимоти Бернерс-Ли заканчивает Оксфордский университет с отличием и получает степень бакалавра-физика. Переехав в Дорсет, будущий создатель интернета устраивается в корпорацию «Plessey». Здесь Тим Бернерс занимается тем, что программирует системы передачи информации, распределения транзакций и создаёт технологию штрих-кодов.

В 1978 году Тимоти Джон Бернерс-Ли меняет место работы. В компании «D.G Nash Ltd» изменяется и круг его обязанностей: теперь Тим Бернерс создаёт программы для принтеров и многозадачных систем.

В Швейцарию Тим Бернерс-Ли был приглашён в 1980 году, где в Европейской организации по ядерным исследованиям будущий создатель интернета работает консультантом по программному обеспечению. Именно в Швейцарии Тим Бернерс после работы начинает трудиться над программой Enquire – основой основ World Wide Web.

В 1981 году Тим Бернерс-Ли поступает на работу в «Image Computer Systems Ltd», где успешно занимается графическим и коммуникативным программным обеспечением и архитектурой систем реального времени. Позднее, в 1984 году будущий создатель интернета приступает к разработке системы реального времени, которая призвана служить для сбора научной информации. Параллельно Тим Бернерс-Ли разрабатывает приложения компьютерной технологии, ускоряющие частицы, а также другое научное оборудование.

На вопрос, в каком году создали Всемирную паутину –интернет, можно ответить, что в 1989 году. Именно тогда Тим Бернерс-Ли предлагает своему руководству идею World Wide Web, в основу которой положена концепция Enquire. Это было началом изобретения интернета. Название «Всемирная паутина» придумал сам, опираясь на связывание самых разных гипертекстовых веб-страниц при помощи гипер-ссылок, протокола передачи данных. Ранее эти протоколы использовали в военной сети США ARPANET. Он, а также протокол университетской сети NSFNET, и стали предшественниками Всемирной паутины, благодаря им появился интернет.

А теперь выступление того, кто создал интернет в видео (на английском, но с субтитрами):

Рождение Всемирной паутины


В замечательном 1989 году протокол получил новую сферу деятельности: им стали пользоваться для обмена почтой и общения в реальном времени, в коммерческих целях и чтения новостных групп. Идея, которую предложил Тим Бернерс-Ли, была принята руководителем Майком Сэнделлом. Но крупных средств для работы Тим Бернерс не получил, лишь предложение провести эксперименты на одном из персональных компьютеров фирмы NeXT.

Несмотря на трудности, Тим Бернерс успешно справляется с поставленной перед собой задачей: он разрабатывает первый в истории веб-сервер и первый веб-браузер. Его таланту разработчика обязаны своим появлением редактор страниц WorldWideWeb, стандартизированный способ записи адреса сайта в Интернете, язык HTML и протокол прикладного уровня передачи данных.

В следующем году Тим Бернерс-Ли получил помощника – бельгийца Роберта Кайо. Благодаря ему интернет-проект получил финансирование. Также Роберт взял на себя все организационные вопросы. Несмотря на активное участие в разработке и продвижении проекта, в историю вошёл главный создатель интернета – Тим Бернерс-Ли – имя которого почитают все программисты мира. Роберт Кайо не оставил за собой права на взимание платы за использование изобретения и был незаслуженно забыт.

Позднее, в 1993 году, Тим Бернерс-Ли создал несколько браузеров под различные операционные системы, что увеличило долю World Wide Web (WWW) в совокупном интернет-трафике.

Интересен тот факт, что ранее Университетом Миннесоты был разработан протокол Gopher, который вполне мог стать альтернативой современного интернета. Но Тим Бернерс-Ли оспаривает этот факт, выдвигая мнение о том, что тот протокол не выдержал бы конкуренции с World Wide Web (WWW) из-за того, что создатели данного проекта требовали за его внедрение платы.

Интернет – это система связи и одновременно информационная система – среда общения людей. В настоящее время существует много определений этого понятия. На наш взгляд одним из определений Интернета, наиболее полно характеризующим информационное взаимодействие населения планеты, является: «Интернет–это сложная транспортно–информационная система из грибовидных (дипольных) структур, шляпка каждой из которых (собственно диполи) представляет собой мозг человека, сидящего за компьютером, в совокупности с самим компьютером, который как бы является искусственным продолжением мозга, а ножки, например, телефонная сеть, соединяющая компьютеры, или эфир, через который передаются радиоволны».

Появление Интернета дало толчок развитию новых информационных технологий, ведущих не только к изменению сознания людей, но и мира в целом. Однако всемирная компьютерная сеть не была первым открытием подобного рода. Сегодня Интернет развивается по такой же схеме, как и его предшественники – телеграф, телефон и радио. Однако в отличие от них, он объединил в себе их достоинства – стал не только полезным для связи между людьми, но и общедоступным средством для получения и обмена информацией. Надо добавить, что и возможности не только стационарного, но и мобильного телевидения стали использоваться в Интернете уже в полной мере.

История Интернета начинается примерно в 60-годы XX века.

Первым документальным описанием социального взаимодействия, которое станет возможным благодаря сети, была серия заметок, написанных Дж. Ликлайдером. В этих заметках обсуждалась концепция «Галактической сети» («Galactic Network»). Автор предвидел создание глобальной сети взаимосвязанных компьютеров, с помощью которой каждый сможет быстро получать доступ к данным и программам, расположенным на любом компьютере. По духу эта концепция очень близка к современному состоянию Интернет.

Леонард Клейнрок в июле 1961 г. опубликовал первую статью по теории пакетной коммутации. В статье он представил преимущества своей теории перед существующим принципом передачи данных – коммутацией каналов. В чем различие этих концепций? При коммутации пакетов – отсутствует физическая связь между двумя оконечными устройствами (компьютерами). При этом необходимые для передачи данные разбиваются на части. К каждой части присоединяется заголовок, содержащий полную информацию о доставке пакета по назначению. При коммутации каналов на время передачи информации два компьютера физически соединяются « каждый с каждым». В период соединения происходит передача всего объема информации. Это соединение сохраняется до окончания передачи информации, т. е. также как это и было при передаче информации по аналоговым системам, обеспечивающим коммутацию соединений. При этом коэффициент использования информационного канала минимален.

Для проверки концепции пакетной коммутации каналов Лоренс Робертс и Томас Мерилл в 1965 году соединили компьютер TX-2 в Массачусетс с компьютером Q-32 в Калифорнии с помощью низкоскоростных телефонных коммутируемых линий. Таким образом, была создана первая в истории (хотя и маленькая) нелокальная компьютерная сеть. Результатом эксперимента стало понимание того, что компьютеры с разделением по времени могут успешно работать вместе, выполняя программы и осуществляя выборку данных на удаленной машине. Стало ясно и то, что телефонная система с коммутацией каналов (соединений) абсолютно непригодна для построения компьютерной сети.

В 1969 американское агентство ARPA (Агентство передовых исследовательских проектов) занялось исследованиями по созданию экспериментальной сети «с коммутацией пакетов». Эта сеть была создана и получила наименование ARPANET, т.е. сеть агентства передовых исследовательских проектов. Эскиз сети ARANET, состоящий из четырех узлов – эмбрион Интернета представлен на рис. 6.1 .

На этой ранней стадии велись исследования, как по сетевой инфраструктуре, так и по сетевым приложениям. Одновременно велись работы по созданию функционально полного протокола межкомпьютерного взаимодействия и другого сетевого программного обеспечения.

В декабре 1970 года сетевая рабочая группа (Network Working Group, NWG) под руководством С. Крокера завершила работу над первой версией протокола, получившего название Протокол управления сетью (Network Control Protocol, NCP). После того, как в 1971 – 1972 годах были выполнены работы по реализации NCP на узлах ARPANET, пользователи сети, наконец, смогли приступить к разработке приложений.

В 1972 году появилось первое приложение – электронная почта.

В марте 1972 г. Рэй Томлинсон написал базовые программы пересылки и чтения электронных сообщений. В июле этого же года Робертс добавил к этим программам возможности выдачи списка сообщений, выборочного чтения, сохранения в файле, пересылки и подготовки ответа.

С тех пор электронная почта стала крупнейшим сетевым приложением. Для своего времени электронная почта стала тем же, чем в наши дни является Всемирная паутина – исключительно мощным катализатором роста обмена всех видов межперсональных потоков данных.

В 1974 году Internet Network Working Group (INWG) представила универсальный протокол передачи данных и объединения сетей – TCP/IP. В современном Интернете используется именно этот протокол.

Тем не менее, переход ARPANET с протокола NCP на TCP/IP состоялся только 1 января 1983 года. Это был переход в стиле «Дня X», требующий одновременных изменений на всех компьютерах. Переход тщательно планировался всеми заинтересованными сторонами в течение нескольких предшествующих лет и прошел на удивление гладко (однако, он привел к распространению значка «Я пережил переход на TCP/IP»). В 1983 году перевод ARPANET с NCP на TCP/IP позволил разделить эту сеть на MILNET, собственно сеть для военных нужд, и ARPANET, использовавшуюся в исследовательских целях.

В этом же году произошло еще одно важное событие. Пол Мокапетрис (Paul Mockapetris) разработал доменную систему имен (Domain Name System, DNS). Эта система позволила создать масштабируемый распределенный механизм для отображения иерархических имен компьютеров (например, www.acm.org) в Интернет–адресах.

В этом же 1983 году в университете Висконсии был создан сервер доменных имен (Domain Name Server, DNS). Данный сервер (DNS) автоматически и скрытно от пользователя обеспечивает перевод словарного эквивалент сайта в IP-адрес.

С всеобщим распространением Сети за пределы США появились национальные домены первого уровня ru, uk, ua и т. д.

В 1985 году, Фонд Национальной Науки (NSF) принял участие в создании собственной сети NSFNet, которая вскоре была подключена к Интернету. Первоначально в состав NSF входили 5 суперкомпьютерных центров, впрочем, меньше, чем в APRANET, а скорость передачи данных в каналах связи не превышала 56 кбит/с. В то же время, создание NSFNet стало заметным вкладом в развитие Интернет, поскольку позволило по-новому взглянуть на то, как можно использовать Интернет. Фонд поставил задачу, чтобы каждый ученый, каждый инженер в США оказались «подключенным» к единой сети, а потому приступили к созданию сети с более быстрыми каналами, которая бы объединила многочисленные региональные и локальные сети.

На основе технологии ARPANET в 1986 г. была создана сеть NSFNET (the National Science Foundation NETwork – Сеть Национального научного фонда), в создании которой приняли непосредственное участие NASA и Министерство энергетики. Было соединено шесть крупных научно-исследовательских центров, оснащенных новейшими суперкомпьютерами, расположенных в разных регионах США. Основной целью этой сети было предоставление научным центрам США доступа к суперкомпьютерам, на основе опорной межрегиональной сети. Сеть работала на базовой скорости 56 Кбит/с. При создании сети стало очевидным, что не стоит даже и пытаться соединить все университеты и исследовательские организации непосредственно с центрами, т. к. проложить такое количество кабеля не только очень дорого, но практически невозможно. Поэтому решили создавать сети по региональному принципу. В каждой части страны заинтересованные учреждения соединялись со своими ближайшими соседями. Получившиеся цепочки подсоединялись к суперкомпьютерным центрам через один из своих узлов, таким образом, суперкомпьютерные центры были соединены вместе. При такой конструкции любой компьютер мог связаться с любым другим, передавая сообщения через соседей .

Одна из проблем, существовавшая в то время, заключалась в том, что ранние сети (в том числе ARPANET) строились целенаправленно в интересах узкого круга заинтересованных организаций. Они должны были использоваться замкнутым сообществом специалистов; как правило, этим работа сетей и ограничивалась. Особой потребности в совместимости сетей не было, соответственно, не было и самой совместимости. В это же время в коммерческом секторе начали появляться альтернативные технологии, такие как XNS от компании Xerox, DECNet, а также SNA от IBM. Поэтому под эгидой DARPA NSFNET, совместно со специалистами из подведомственных тематических групп по технологии и архитектуре Интернета (Internet Engineering and Architecture Task Forces) и членами Сетевой технической консультативной группы NSF, были разработаны «Требования к Интернет-шлюзам». Эти требования формально гарантировали совместимость частей Интернета, находящихся в ведении DARPA и NSF. Помимо выбора TCP/IP как основы NSFNet федеральные агентства США приняли и реализовали ряд дополнительных принципов и правил, сформировавших современный облик Интернета. Что очень важно, NSFNET проводило политику «всеобщего и равного доступа в Internet». В самом деле, чтобы американский университет мог получить от NSF средства на подключение к Интернету, он, как было записано в программе NSFNet, «должен обеспечить доступность этого подключения для всех подготовленных пользователей в университетском городке» .

NSFNET поначалу работала вполне успешно. Но настало время, когда она перестала справляться с возросшими потребностями. Сеть, созданная для пользования суперкомпьютерами, позволяла подключенным организациям пользоваться и множеством информационных данных к суперкомпьютерам не относящимся. Пользователи Сети в научных центрах, университетах, школах и т. п. поняли, что им теперь доступно море информации и что они получили непосредственный доступ к своим коллегам. Поток сообщений в Сети нарастал все быстрее и быстрее, пока, в конце концов, не перегрузил управляющие сетью компьютеры и связывающие их телефонные линии.

В 1987 г. NSF передала компании Merit Network Inc. контракт, по которому Merit при участии IBM и MCI должна была обеспечивать управление опорной сетью NSFNET, осуществить переход на более скоростные каналы Т-1 и продолжить ее развитие. Растущая опорная сеть уже объединяла более 10 узлов.

В 1990 году понятия ARPANET, NFSNET, MILNET и др. окончательно ушли со сцены, уступив место понятию Интернет.

Размах сети NSFNET в сочетании с качеством протоколов привели к тому, что к 1990 году, когда окончательно разукомплектовали ARPANET, семейство TCP/IP вытеснило или значительно потеснило во всем мире большинство других протоколов глобальных компьютерных сетей, а IP уверенно становился доминирующим сервисом транспортировки данных в глобальной информационной инфраструктуре.

В 1990 г. Европейская организация по ядерным исследованиям (European Organization for Nuclear Research) организовала крупнейший Интернет-сайт в Европе и обеспечила доступ в Интернет Старого света. С целью оказания помощи в продвижении и содействия концепции распределенных вычислений через Интернет CERN (Швейцария, Женева) Тим Бернерс-Ли (Tim Berners-Lee) разработал технологию гипертекстовых документов – World Wide Web (WWW), позволяющую пользователям иметь доступ к любой информации, находящейся в сети Интернет на компьютерах по всему миру.

В основе технологии WWW лежат: определение спецификаций URL (Universal Resource Locator, всеобщий указатель ресурса), HTTP (HyperText Transfer Protocol, протокол передачи гипертекста) и собственно язык HTML (HyperText Markup Language, язык разметки гипертекста). Текст можно разметить в HTML с помощью любого текстового редактора. Страницу, размеченную в HTML, часто называют Web-страницей. Для просмотра Web-страницы используется клиентское приложение – Web-браузер.

В 1994 г. образовался консорциум W3C (W3 Consortium), который объединил ученых из разных университетов и компаний (в том числе Netscape и Microsoft). С этого времени комитет стал заниматься всеми стандартами в мире Интернета. Первым шагом организации стала разработка спецификации HTML 2.0. В данной версии появилась возможность передачи информации с компьютера пользователя на сервер с помощью форм. Следующим шагом стал проект HTML 3, работа над которым началась в 1995 г. Впервые была введена система CSS (Cascading Style Sheets, иерархические таблицы стилей). CSS позволяет осуществить форматирование текста без нарушения логической и структурной разметки. Стандарт HTML 3 так и не был утвержден, вместо него был создан и принят в январе 1997 г. HTML 3.2. Уже в декабре 1997 г. W3C принимает стандарт HTML 4.0, в котором идет разделение на логические и визуальные теги.

К 1995 году темпы роста сети Интернет показали, что регулирование вопросов подключения и финансирования не может находиться в руках одного NSF. В 1995 году произошла передача региональным сетям оплаты за подсоединение многочисленных частных сетей к национальной магистрали.

Интернет вырос далеко за пределы того, каким его видели и проектировали, он перерос те агентства и организации, которые его создавали, они более не могли играть в его росте доминирующую роль. Сегодня это мощная всемирная сеть связи, основанная на распределенных коммутационных элементах - хабах и каналах связи. С 1983 года Интернет растет по экспоненте, и едва ли ни одна деталь сохранилась с тех времен, – Интернет все еще работает на основе набора протоколов TCP/IP.

Если термин «Интернет» первоначально использовался для описания сети, построенной на базе Интернет – протокола IP, то сейчас это слово приобрело глобальный смысл и лишь иногда применяется в качестве названия набора объединенных сетей. Строго говоря –Интернет, это любой набор отдельных в физическом смысле сетей, которые соединены между собой единым протоколом IP, что позволяет говорить о них, как об одной логической сети. Бурный рост Интернет, вызвал повышенный интерес к протоколам TCP/IP, в итоге появились специалисты и компании, которые нашли для него и ряд других приложений. Этот протокол начал использоваться для построения локальных вычислительных сетей (LAN - Local Area Network) даже тогда, когда не предусматривалось их подключение к сети Интернет. Кроме того, TCP/IP стал применяться при создании корпоративных сетей, которые взяли на вооружение Интернет – технологии, в том числе WWW (World Wide Web) – мировую паутину, чтобы наладить эффективный обмен внутрикорпоративной информацией. Эти корпоративные сети получили название «Интранет» и могут либо подключаться, либо нет к сети Интернет.

Изобретателем всемирной паутины считается Тим Бернерс-Ли, являющийся автором технологий HTTP, URI/URL и HTML . В 1980 году он для собственных нужд написал программу «Энквайр» («Дознаватель»), которая использовала случайные ассоциации для хранения данных и заложила концептуальную основу для Всемирной паутины. В 1989 году Тим Бернерс-Ли предложил глобальный гипертекстовый проект, теперь известный как Всемирная паутина. Проект подразумевал публикацию гипертекстовых документов, связанных между собой гиперссылками, что облегчило бы поиск и консолидацию информации для учёных. Для осуществления проекта им были изобретены идентификаторы URI, протокол HTTP и язык HTML. Это технологии, без которых уже нельзя себе представить современный Интернет. В период с 1991 по 1993 год Бернерс-Ли усовершенствовал технические спецификации этих стандартов и опубликовал их. Им был написал первый в мире веб-сервер «httpd» и первый в мире гипертекстовый веб-браузер, называвшийся «WorldWideWeb». Этот браузер был одновременно и WYSIWYG-редактором (сокр. от англ. What You See Is What You Get – что видишь, то и получишь), его разработка была начата в октябре 1990 года, а закончена в декабре того же года. Программа работала в среде «NeXTStep» и начала распространяться по Интернету летом 1991 года. Первый в мире Web –сайт Бернерс-Ли создал по адресу http://info.cern.ch/, теперь сайт хранится в архиве. Этот сайт появился он-лайн в Интернете 6 августа 1991 года. На этом сайте описывалось, что такое Всемирная паутина, как установить Web –сервер, как использовать браузер и т. п. Этот сайт также являлся первым в мире интернет-каталогом, потому что позже Тим Бернерс-Ли разместил и поддерживал там список ссылок на другие сайты.

С 1994 года основную работу по развитию Всемирной паутины взял на себя Консорциум Всемирной паутины (англ. World Wide Web Consortium, W3C), основанный Тимом Бернерсом-Ли. Данный Консорциум – организация, разрабатывающая и внедряющая технологические стандарты для Интернета и Всемирной паутины. Миссия W3C: «Полностью раскрыть потенциал Всемирной паутины, путём создания протоколов и принципов, гарантирующих долгосрочное развитие Сети». Две другие важнейшие задачи Консорциума – обеспечить полную «интернационализа́цию Сети́» и сделать Сеть доступной для людей с ограниченными возможностями.

W3C разрабатывает для Интернета единые принципы и стандарты (называемые «Рекоменда́циями», англ. W3C Recommendations), которые затем внедряются производителями программ и оборудования. Таким образом достигается совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной. Все Рекомендации Консорциума Всемирной паутины открыты, то есть не защищены патентами и могут внедряться любым человеком без всяких финансовых отчислений консорциуму.

В настоящее время всемирную паутину образуют миллионы Web –серверов сети Интернет, расположенных по всему миру. Web –сервер является программой, запускаемой на подключённом к сети компьютере и использующей протокол HTTP для передачи данных. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные Web–серверы способны динамически распределять ресурсы в ответ на HTTP-запрос. Для идентификации ресурсов (зачастую файлов или их частей) во Всемирной паутине используются единообразные идентификаторы ресурсов URI (англ. Uniform Resource Identifier). Для определения местонахождения ресурсов в сети используются единообразные локаторы ресурсов URL (англ. Uniform Resource Locator). Такие URL-локаторы сочетают в себе технологию идентификации URI и систему доменных имён DNS (англ. Domain Name System) – доменное имя (или непосредственно IP-адрес в числовой записи) входит в состав URL для обозначения компьютера (точнее – одного из его сетевых интерфейсов), который исполняет код нужного Web –сервера .

Для просмотра информации, полученной от Web –сервера, на клиентском компьютере применяется специальная программа – Web –браузер. Основная функция Web –браузера – отображение гипертекста. Всемирная паутина неразрывно связана с понятиями гипертекста и гиперссы́лки. Большая часть информации в Webе представляет из себя именно гипертекст. Для облегчения создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык HTML (англ. HyperText Markup Language), язык разметки гипертекста. Работа по разметке гипертекста называется вёрсткой, мастера по разметке называют веб-мастером. После HTML-разметки получившийся гипертекст помещается в файл, такой HTML-файл является самым распространённым ресурсом Всемирной паутины. После того, как HTML-файл становится доступен веб-серверу, его начинают называть «веб-страницей». Набор веб-страниц образует веб-сайт. В гипертекст веб-страниц добавляются гиперссылки. Гиперссылки помогают пользователям Всемирной паутины легко перемещаться между ресурсами (файлами) вне зависимости от того, находятся ресурсы на локальном компьютере или на удалённом сервере. Гиперссылки «веба» основаны на технологии URL.

В целом можно заключить, что Всемирная паутина стоит на «трёх китах»: HTTP, HTML и URL. Хотя в последнее время HTML начал несколько сдавать свои позиции и уступать их более современным технологиям разметки: XHTML и XML. XML (англ. eXtensible Markup Language) позиционируется как фундамент для других языков разметки. Для улучшения визуального восприятия веба стала широко применяться технология CSS, которая позволяет задавать единые стили оформления для множества веб-страниц. Ещё одно нововведение, на которое стоит обратить внимание, – система обозначения ресурсов URN (англ. Uniform Resource Name).

Популярная концепция развития Всемирной паутины – создание семантической паутины. Семантическая паутина – это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров. Семантическая паутина – это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру. Семантическая паутина открывает доступ к чётко структурированной информации для любых приложений, независимо от платформы и независимо от языков программирования. Программы смогут сами находить нужные ресурсы, обрабатывать информацию, классифицировать данные, выявлять логические связи, делать выводы и даже принимать решения на основе этих выводов. При широком распространении и грамотном внедрении семантическая паутина может вызвать революцию в Интернете. Для создания понятного компьютеру описания ресурса в семантической паутине используется формат RDF (англ. Resource Description Framework), который основан на синтаксисе XML и использует идентификаторы URI для обозначения ресурсов. Новинки в этой области – это RDFS (англ. RDF Schema) и SPARQL (англ. Protocol And RDF Query Language) (произносится как «спа́ркл»), новый язык запросов для быстрого доступа к данным RDF.

В настоящее время наметились две тенденции в развитии Всемирной паутины: семантическая паутина и социальная паутина. Семантическая паутина предполагает улучшение связности и релевантности информации во Всемирной паутине через введение новых форматов метаданных. Социальная паутина полагается на работу по упорядочиванию имеющейся в Паутине информации, выполняемую самими пользователями Паутины. В рамках второго направления наработки, являющиеся частью семантической паутины, активно используются в качестве инструментов (RSS и другие форматы веб-каналов, OPML, микроформаты XHTML).

Одним из самых современных и экономичных видов связи стала Интернет-телефония. Днем ее рождения можно считать 15 февраля 1995 года, когда фирма VocalTec выпустила свой первый soft-phone – программу, служащую для обмена голосом по сети IP. Затем Microsoft выпустил в октябре 1996 года первую версию NetMeeting. А уже в 1997 году стали вполне обычными соединения через Интернет двух обычных телефонных абонентов, находящихся в совершенно разных местах планеты.

Почему обычная междугородная и международная телефонная связь так дорога? Объясняется это тем, что во время разговора абонент занимает целый канал связи, причем не только когда говорит или слушает собеседника, но и когда молчит или отвлекается от разговора. Так происходит при передаче голоса по телефону обычным аналоговым способом.

При цифровом же способе информацию можно передавать не непрерывно, а отдельными «пакетами». Тогда по одному каналу связи можно посылать информацию одновременно от многих абонентов. Этот принцип пакетной передачи информации подобен перевозке множества писем с разными адресами в одном почтовом вагоне. Ведь не «гоняют» же один почтовый вагон для перевозки каждого письма в отдельности! Такое временное «пакетное уплотнение» позволяет намного эффективнее использовать существующие каналы связи, «сжимать» их. На одном конце канала связи информация делится на пакеты, каждый из которых, подобно письму, снабжается своим индивидуальным адресом. По каналу связи пакеты многих абонентов передаются «вперемежку». На другом конце канала связи пакеты с одним адресом снова объединяются и направляются своему адресату. Такой пакетный принцип широко используется в сети Интернет .

Имея персональный компьютер, звуковую карту, совместимые с ней микрофон и наушники (или звуковые колонки), абонент может с помощью Интернет-телефонии позвонить любому абоненту, у которого имеется обычный городской телефон. При этом разговоре он также будет платить только за пользование Интернетом. Перед началом пользования Интернет-телефонией абоненту – владельцу персонального компьютера необходимо установить на него специальную программу.

Для пользования услугами Интернет-телефонии не обязательно иметь персональный компьютер. Для этого достаточно иметь обычный телефон с тональным набором. В этом случае каждая набранная цифра уходит в линию не в виде разного количества электрических импульсов, как при вращении диска, а в виде переменных токов разной частоты. Такой тоновый режим есть в большинстве современных телефонных аппаратов. Для пользования Интернет-телефонией с помощью телефонного аппарата нужно купить кредитную карточку, и позвонить на мощный центральный компьютер-сервер по указанному на карточке номеру. Затем автомат сервера голосом (по выбору на русском или английском языке) сообщает команды: набрать с помощью кнопок телефонного аппарата серийный номер и ключ карточки, набрать код страны и номер своего будущего собеседника. Далее сервер превращает аналоговый сигнал в цифровой, отправляет его в другой город, в находящийся там сервер, который снова преобразует цифровой сигнал в аналоговый и отправляет его нужному абоненту. Собеседники разговаривают как по обычному телефону, правда, иногда чувствуется небольшая (на доли секунды) задержка ответа. Напомним, что для экономии каналов связи голосовая информация передается «пакетами» цифровых данных: ваша голосовая информация расчленяется на отрезки, пакеты, называемые Интернет-протоколами (IP).

В 2003 году была создана программа Skype (www.skype.com), совершенно бесплатная и не требующая от пользователя практически никаких знаний ни для ее установки, ни для использования. Она позволяет разговаривать в режиме видеосопровождения с собеседниками, находящимися у своих компьютеров в разных концах света. Для того чтобы собеседники могли видеть друг друга, компьютер каждого из них должен быть снабжен web-камерой.

Вот такой длинный путь в развитии средств связи проделало человечество: от сигнальных костров и барабанов до сотового мобильного телефона, который позволяет практически мгновенно связаться двум людям, находящимся в любых точках нашей планеты. При этом, несмотря на различные расстояния, у абонентов создается ощущение личного общения.

Всемирная паутина (сокращенно World Wide Web или WWW) - это единство информационных ресурсов, которые связаны между собой средствами телекоммуникаций и основаны на гипертекстовом представлении данных, разбросанных по всему миру.

Годом рождения Всемирной паутины считается 1989 год. Именно в этом году Тим Бернерс-Ли предложил общий гипертекстовый проект, который получил впоследствии название Всемирной паутины.

Создатель «паутины» Тим Бернес-Ли, работая в лаборатории физики элементарных частиц европейского центра ядерных исследований «CERN» В Женеве (Швейцария), совместно с партнером Робертом Кайо занимались проблемами применения идей гипертекста для построения информационной среды, которая упростила бы обмен информацией между физиками.

Итогом данной работы явился документ, в котором рассматривались понятия, имеющие принципиальное значение для «паутины» в ее современном виде, и были предложены идентификаторы URI, протокол HTTR и язык HTML. Без данных технологий уже нельзя представить современный Интернет.

Бернерс-Ли создал первый в мире веб-сервер и первый в мире гипертекстовый веб-браузер. На первом в мире веб-сайте он описал, что такое Всемирная паутина и как установить веб-сервер, как использовать браузер и т.п. Этот сайт являлся и первым в мире Интернет-каталогом.

Начиная с 1994 года самые главные задачи по развитию Всемирной паутины взял на себя Консорциум Всемирной паутины (World Wide Web Consortium, WЗС ), который организовал и до сих пор возглавляет Ким Бернес-Ли. Консорциум разрабатывает и внедряет технологические стандарты для Интернета и Всемирной паутины. Миссия WЗС: «Полностью раскрыть потенциал Всемирной паутины, путем создания протоколов и принципов, гарантирующих долгосрочное развитие Сети» . WЗС разрабатывает «Рекомендации», что бы достичь совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной.

Поисковые системы: состав, функции, принципы работы.

Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google» , «Yahoo» , «MSN» . В русском Интернете это – «Яндекс» , «Рамблер» , «Апорт» .

Опишем основные характеристики поисковых систем :

    Полнота

Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

    Точность

Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

    Актуальность

Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

    Скорость поиска

Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

    Наглядность

Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.одробные пояснения по странице результатов поиска, например у «Яндекса» можно посмотреть по ссылке http://help.yandex.ru/search/?id=481937 .

Краткая история развития поисковых систем

В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.

Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.

Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.

Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!

В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.

В настоящее время существуют три основные международные поисковые системы – Google, Yahoo и MSN, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.

Состав и принципы работы поисковой системы

В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

    URL страницы

    дата, когда страница была скачана

    http-заголовок ответа сервера

    тело страницы (html-код)

Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных

База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

    Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).

    Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.

    В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).

    Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.

    Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

Ни одна поисковая система не охватывает все ресурсы Интернет.

Каждая поисковая система собирает сведения о ресурсах Интернет, применяя свои уникальные методы, и формирует собственную периодически обновляемую базу данных. Доступ к этой базе предоставляется пользователю.

Поисковые системы реализуют два способа поиска ресурса:

    Поиск по тематическим каталогам - информация представляется в виде иерархической структуры. На верхнем уровне - общие категории (“Интернет”, “Бизнес”, “Искусство”, “Образование” и т.д.), на следующем уровне категории делятся на разделы и т.д. Самый нижний уровень - ссылки на конкретные веб-страницы или другие информационные ресурсы.

    Поиск по ключевым словам (индексный поиск или детальный) - пользователь отправляет поисковой системе запрос , состоящий из ключевых слов. Система возвращает пользователю перечень найденных по запросу ресурсов.

Большинство поисковых систем сочетают оба способа поиска.

Поисковые системы могут быть локальными, глобальными, региональными и специализированными.

В русской части Интернет (Рунет) наиболее популярны сейчас поисковые системы общего назначения Rambler (www.rambler.ru), Яндекс (www.yandex.ru), Апорт (www.aport.ru), Гугл (www.google.ru).

Большинство поисковых систем реализовано в виде порталов.

Портал (от англ. portal - главный вход, ворота) -это веб-сайт, который интегрирует различные сервисы Интернет: средства поиска, почту, новости, словари и т.д.

Порталы могут быть специализированными (как, www . museum . ru ) и общими (например, www . km . ru ).

Поиск по ключевым словам

Набор ключевых слов, по которым ведется поиск, называют также критерием поиска или темой поиска.

Запрос может состоять как из одного слова, так и из сочетания слов, объединенных операторами - символами, по которым система определяет, какое действие ей нужно произвести. Например: запрос “Москва Питер” содержит оператор И (так воспринимается пробел), который указывает, что надо искать документы, в которых есть оба слова - и Москва, и Питер.

Для того, чтобы поиск был релевантным (от англ. relevant -уместный, относящийся к делу), следует учитывать несколько общих правил:

    Независимо от того, в какой форме употреблено слово в запросе, поиск учитывает все его словоформы по правилам русского языка. Например, по запросу “билет” будут найдены и слова “билетом”, “билету” и т.д.

    Заглавные буквы следует использовать только в именах собственных, чтобы не просматривать лишние ссылки. По запросу “кузнецов”, например, будут найдены документы, где говорится и о кузнецах, и о Кузнецовых.

    Желательно сужать круг поиска, используя несколько ключевых слов.

    Если нужного адреса нет среди первой двадцатки найденных адресов, следует изменить запрос.

Каждая поисковая система использует свой язык запросов. Для знакомства с ним, пользуйтесь встроенной справкой поисковой системы

Крупные сайты могут иметь встроенные системы поиска информации в пределах своих веб-страниц.

Запросы в подобных системах поиска, как правило, строятся по тем же правилам, что и в глобальных поисковых системах, однако знакомство со справкой и здесь не будет лишним.

Расширенный поиск

Поисковые системы могут предоставлять в распоряжение пользователя механизм, позволяющий формировать сложный запрос. Переход по ссылке Расширенный поиск дает возможность редактировать параметры поиска, указывать дополнительные параметры и выбирать наиболее удобную форму показа результатов поиска. Ниже описаны параметры, которые могут быть заданы при расширенном поиске в системах Япс1ех и Rambler.

Описание параметра

Название в Яндекс

Название в Rambler

Где искать ключевые слова (заголовок документа, основной текст и т.д.)

Словарный фильтр

Поиск по тексту...

Какие слова должны или не должны присутствовать в документе и насколько точным должно быть совпадение

Словарный фильтр

Искать слова запроса... Исключить документы, содержащие следующие слова...

На каком расстоянии друг от друга должны располагаться ключевые слова

Словарный фильтр

Расстояние между словами запроса...

Ограничение на дату документа

Дата документа...

Ограничение поиска пределами одного или нескольких сайтов

Сайт/Вершина

Искать документы только на следующих сайтах...

Ограничение поиска по языку документа

Язык документа...

Поиск документов, содержащих картинку с определенным именем или подписью

Изображение

Поиск страниц, содержащих объекты

Специальные объекты

Форма представления результатов поиска

Формат выдачи

Вывод результатов поиска

Некоторые поисковые системы (например, Яндекс) позволяют вводить запросы на естественном языке. Вы пишите, что нужно найти (например: заказ билетов на поезд из Москвы в Питер). Система анализирует запрос и выдает результат. Если он Вас не устраивает, переходите на язык запросов.