Протокол передачи гипертекста (HTTP)

Автор работы: Пользователь скрыл имя, 10 Сентября 2013 в 22:37, курсовая работа

Краткое описание

Протокол HTTP - это протокол запросов/ответов. Клиент посылает по соединению запрос серверу, содержащий: метод запроса, URI, версию протокола, MIME-подобное сообщение, включающее модификаторы запроса, клиентскую информацию и, возможно, тело запроса. Сервер отвечает строкой состояния, включающей версию протокола сообщения, кодом успешного выполнения или ошибки, MIME-подобным сообщением, содержащим информацию о сервере, метаинформацию объекта и, возможно, тело объекта.
Большинство HTTP соединений, инициализируется агентом пользователя и состоит из запроса, который нужно применить к ресурсу на некотором первоначальном сервере. В самом простом случае, он может быть выполнен посредством одиночного соединения между агентом пользователя и первоначальным сервером

Вложенные файлы: 1 файл

HTTP.docx

— 151.08 Кб (Скачать файл)

Серверы должны обращать внимание на URI, которые имеют длину более 255 байтов, потому что некоторые старые клиенты или прокси-сервера могут неправильно поддерживать эти длины.

 

 

 

 

 

HTTP URI

Http" схема используется для доступа к сетевым ресурсам при помощи протокола HTTP. Этот раздел определяет схемо-определенный синтаксис и семантику для HTTP URL.

 

http_URL = "http:" "//" host [ ":" port ] [ abs_path ]

 

host = <допустимое доменное имя машины или IP адрес (в точечно десятичной форме), как определено в разделе 2.1 RFC 1123>

 

port = *DIGIT

 

Если порт пуст или не задан - используется порт 80. Это означает, что идентифицированный ресурс размещен в сервере, ожидающем TCP соединений на специфицированном порте port, компьютера host, и запрашиваемый URI ресурса - abs_path. Использования IP адресов в URL следует избегать, насколько это возможно (RFC 1900). Если abs_path не представлен в URL, он должен рассматриваться как "/" при вычислении запрашиваемого URI (Request-URI) ресурса.

 

HTTP сообщение (HTTP Message).

 

Типы сообщений

 

HTTP сообщения делятся на запросы клиента серверу и ответы сервера клиенту.

 

HTTP-message = Request | Response ; сообщения HTTP/1.1

 

Сообщения запроса и ответа используют обобщенный формат сообщения  RFC 822 для пересылки объектов (полезной нагрузки сообщения). Оба типа сообщений выглядят следующим образом: сначала идет начальная строка (start-line), затем один или несколько полей заголовка (называемых также просто "заголовки"), затем пустая строка (то есть строка, равная CRLF), указывающая конец полей заголовка, а затем, возможно, тело сообщения.

 

generic-message = start-line *message-header CRLF [ message-body ]

 

start-line = Request-Line | Status-Line

 

В интересах ошибкоустойчивости, серверам следует игнорировать все  пустые строки, полученные перед строкой  запроса (Request-Line). Другими словами, если сервер читает поток протокола и в самом начале сообщения получает CRLF, то ему следует этот CRLF игнорировать.

Некоторые ошибочные реализации HTTP/1.0 клиентов генерируют дополнительные CRLF после запроса POST. Стоит вновь повторить, что это явно запрещено нормальной записью Бекуса-Наура. HTTP/1.1 клиент не должен добавлять дополнительные CRLF перед запросом и после него.

 

 

 

Заголовок сообщения

 

Поля заголовков HTTP, которые включают поля общих заголовков (general-header), заголовков запроса (request-header), заголовков ответа (response-header), и заголовков объекта (entity-header), имеют такой же обобщенный формат, как RFC 822. Каждое поле заголовка состоит из имени поля, двоеточия (":") и значения поля. Имена полей не чувствительны к регистру. Значению поля может предшествовать любое число LWS, хотя предпочтителен одиночный SP. Поля заголовка могут занимать несколько строк. При этом каждая следующая строка продолжения начинается по крайней мере одним SP или HT. Приложениям следует придерживаться "общей формы" ("common form") при генерации HTTP конструкций, так как могут существовать реализации, которые не в состоянии принимать что-либо кроме общих форм.

 

message-header = field-name ":" [ field-value ] CRLF

 

field-name = token field-value = *( field-content | LWS )

 

field-content = <октеты, составляющие значение поля и состоящие или из *TEXT или из комбинаций лексем, tspecials, и quoted-string>

 

Порядок, в котором получены поля заголовка с различными именами  не имеет значения. Однако "хорошей  практикой" является то, что сначала  посылаются поля общих заголовков, затем поля заголовков запроса или  заголовков ответа, и, наконец, поля заголовков объекта.

Несколько полей заголовка  с одиннаковыми именами могут присутствовать в сообщении тогда и только тогда, когда все значения полей, входящих в заголовок, определяют разделенный запятыми список [то есть #(value)]. Должно быть возможно объединить несколько таких полей заголовка в одну пару "имя поля: значение поля" (не измененяя этим семантику сообщения) путем присоединения каждого последующего значения поля к первому через запятые. Порядок, в котором получены поля с одинаковыми именами, имеет значение для интерпретации объединенного значения поля, и, следовательно, прокси-сервер не должен изменять порядок значений этого поля при пересылке.

 

 

Тело сообщений

 

Тело HTTP сообщения (message-body), если оно присутствует, используется для передачи тела объекта, связанного с запросом или ответом. Тело сообщения (message-body) отличается от тела объекта (entity-body) только в том случае, когда применяется кодирование передачи, что указывается полем заголовка Transfer-Encodingы.

 

message-body = entity-body | <entity-body закодированно согласно Transfer-Encoding>

 

Поле Transfer-Encoding должно использоваться для указания любого кодирования передачи, примененного приложением в целях гарантирования безопасной и правильной передачи сообщения. Поле Transfer-Encoding - это свойство сообщения, а не объекта, и, таким образом, может быть добавлено или удалено любым приложением в цепочке запросов/ответов.

Правила, устанавливающие  допустимость тела сообщения в сообщении, различаются для запросов и ответов.

Присутствие тела сообщения  в запросе отмечается добавлением  к заголовкам запроса поля заголовка  Content-Length или Transfer-Encoding. ело сообщения (message-body) может быть добавлено в запрос только тогда, когда метод запроса допускает тело объекта (entity-body).

Включать или не включать тело сообщения (message-body) в сообщение ответа зависит как от метода запроса, так и от кода состояния ответа. Все ответы на запрос с методом HEAD не должны включать тело сообщения (message-body), даже если присутствуют поля заголовка объекта (entity-header), заставляющие поверить в присутствие объекта. Никакие ответы с информационными кодами состояния 1xx, кодом 204 (Нет содержимого, No Content) и кодом 304 (Не модифицирован, Not Modified) не должны содержать тела сообщения (message-body). Все остальные ответы содержат тело сообщения, даже если оно имеет нулевую длину.

 

Длина сообщений

 

Когда тело сообщения (message-body) присутствует в сообщении, длина этого тела определяется одним из следующих методов (в порядке старшинства):

    1. Любое сообщение ответа, которое не должно включать тело сообщения (message-body) (например ответы с кодами состояния 1xx, 204, 304 и все ответы на запрос HEAD) всегда завершается пустой строкой после полей заголовка, независимо от полей заголовка объекта (entity-header fields), представленных в сообщении.
    2. Если поле заголовка Transfer-Encoding присутствует и указывает на применение кодирования передачи "chunked", то длина определяется кодированием по кускам (chunked encoding).
    3. Если поле заголовка Content-Length присутствует, то его значение представляет длину тела сообщения (message-body) в байтах.
    4. Если сообщение использует медиатип "multipart/byteranges", который саморазграничен, то он и определяет длину. Этот медиа тип не должен использоваться, если отправитель не знает, способен ли получатель его обработать; присутствие в запросе заголовка Range с несколькими спецификаторами диапазонов байтов (byte-range) подразумевает, что клиент может анализировать multipart/byteranges ответы.
    5. Длина определяется закрытием соединения сервером. (Закрытие соединения не может использоваться для указания конца тела запроса, так как в этом случае у сервера не остается никакой возможности послать обратно ответ).

Для совместимости с HTTP/1.0 приложениями HTTP/1.1 запросы, содержащие тело сообщения (message-body) должны включать допустимое поле заголовка Content-Length, пока не известно, что сервер является HTTP/1.1 совместимым. Если запрос содержит тело сообщения (message-body), и Content-Length не указано, серверу следует послать ответ с кодом состояния 400 (Испорченный Запрос, Bad Request), если он не может определить длину сообщения, или с кодом состояния 411 (Требуется длина, Length Required), если он настаивает на получении Content-Length.

Все HTTP/1.1 приложения, которые получают объекты, должны понимать кодирование передачи типа "chunked", таким образом разрешается использование данного механизма для таких сообщений, длина которых не может быть определена заранее.

Сообщения не должны одновременно включать и поле заголовка Content-Length и применять кодирование передачи типа "chunked". Если поступило сообщение с полем Content-Length и закодированное с применением кодирования передачи "chunked", то поле Content-Length должно игнорироваться.

Если поле Content-Length присутствует в сообщении, которое допускает наличие тела сообщения (message-body), то значение поля должно точно соответствовать числу октетов в теле сообщения. HTTP/1.1 агенты пользователя должны информировать пользователя в случае получения и обнаружения недопустимой длины.

 

 

Общие поля заголовка

 

Имеется несколько полей  заголовка, которые применяются  как для сообщений запросов, так  и для сообщений ответов, но которые  не применяются к передаваемому  объекту. Эти поля заголовка применяются  только к передаваемому сообщению.

 

general-header = Cache-Control | Connection | Date | Pragma | Transfer-Encoding | Upgrade | Via

 

Имена общих полей заголовка (general-header fields) могут быть надежно расширены только в сочетании с изменением версии протокола. Однако, новые или экспериментальные поля заголовка могут получить семантику общих полей заголовка (general-header fields), если все стороны соединения распознают их как общие поля заголовка. Нераспознанные поля заголовка обрабатываются как поля заголовка объекта (entity-header).

 

Запрос (Request).

 

Сообщение запроса сервера  клиентом содержит в первой строке: метод, который нужно применить  к ресурсу, идентификатор ресурса  и используемую версию протокола.

 

Request = Request-Line *( general-header | request-header | entity-header ) CRLF [ message-body ]

Строка запроса (Request-Line).

Строка запроса (Request-Line) начинается с лексемы метода, затем следует запрашиваемый URI (Request-URI), версия протокола и CRLF. Эти элементы разделяются SP. В строке запроса (Request-Line) не допустимы CR и LF, исключение составляет конечная последовательность CRLF.

 

Request-Line = Method SP Request-URI SP HTTP-Version CRLF

Метод (Method).

Лексема метода указывает  метод, который нужно применить  к ресурсу, идентифицированному  запрашиваемым URI (Request-URI). Метод чувствителен к регистру.

 

Method = "OPTIONS" | "GET" | "HEAD" | "POST" | "PUT" | "DELETE" | "TRACE" | extension-method

 

extension-method = token

 

Список методов, применимых к ресурсу, может быть указан в  поле заголовка Allow. Возвращаемый код состояния ответа всегда сообщает клиенту, допустим ли метод для ресурса в настоящее время, так как набор допустимых методов может изменяться динамически. Серверам следует возвратить код состояния 405 (Метод не допустим, Method Not Allowed), если метод известен серверу, но не применим для запрошенного ресурса, и 501 (Не реализовано, Not Implemented), если метод не распознан или не реализован сервером. Список методов, известных серверу, может быть указан в поле заголовка ответа Public.

Методы GET и HEAD должны поддерживаться всеми универсальными (general-purpose) серверами. Остальные методы опциональны.

Ресурс, идентифицируемый запросом.

Первоначальные HTTP/1.1 сервера должны учитывать, что  точный ресурс, идентифицируемый интернет-запросом определяется путем исследования запрашиваемого URI (Request-URI) и поля заголовка Host.

Первоначальный сервер, который  не различает ресурсы по запрошенному хосту (host), может игнорировать значение поля заголовка Host.

Первоначальный сервер, который  различает ресурсы на основании  запрошенного хоста (host) (иногда называемые виртуальными хостами или vanity hostnames) должен пользоваться следующими правилами для определения ресурса, запрошенного в HTTP/1.1 запросе:

1. Если Request-URI - это absoluteURI, то хост - это часть Request-URI. Любые значения поля заголовка Host в запросе должны игнорироваться.

2. Если Request-URI - не absoluteURI, а запрос содержит поле заголовка Host, то хост определяется значением поля заголовка Host.

3. Если хоста, определенного  правилами 1 или 2 не существует  на сервере, кодом состояния  ответа должен быть 400 (Испорченный  Запрос, Bad Request).

Получатели HTTP/1.0 запроса, в котором отсутствует поле заголовка Host, могут попытаться использовать эвристику (например, исследовать путь в URI на предмет уникальности на каком-либо из хостов) для определения какой именно ресурс запрашивается.

 

 

 Поля заголовка  запроса.

Поля заголовка запроса  позволяют клиенту передать серверу  дополнительную информацию о запросе  и о самом клиенте. Эти поля действуют как модификаторы запроса  с семантикой, эквивалентной параметрам вызова методов в языках программирования.

 

request-header = Accept | Accept-Charset | Accept-Encoding | Accept-Language | Authorization | From | Host | If-Modified-Since | If-Match | If-None-Match | If-Range | If-Unmodified-Since | Max-Forwards | Proxy-Authorization | Range | Referer | User-Agent

 

Множество имен полей заголовка  запроса (Request-header) может быть надежно расширено только в сочетании с изменением версии протокола. Однако, новые или экспериментальные поля заголовка могут получить семантику полей заголовка запроса (Request-header), если все стороны соединения распознают их как поля заголовка запроса (Request-header). Нераспознанные поля заголовка обрабатываются как поля заголовка объекта (entity-header).

 

 

 

 

 Ответ (Response).

 

После получения и интерпретации  сообщения запроса, сервер отвечает сообщением HTTP ответа.

 

Response = Status-Line *( general-header | response-header | entity-header ) CRLF [ message-body ]

 Строка состояния (Status-Line).

Первая строка ответа - это  строка состояния (Status-Line). Она состоит из версии протокола (HTTP-Version), числового кода состояния (Status-Code) и поясняющей фразы (Reason-Phrase) разделенных символами SP. CR и LF не допустимы в Status-Line, за исключением конечной последовательности CRLF.

 

Status-Line = HTTP-Version SP Status-Code SP Reason-Phrase CRLF

 

 Код состояния и поясняющая фраза.

Информация о работе Протокол передачи гипертекста (HTTP)