2 Введення в HTML 4.0

2.1 Що таке World Wide Web?

World Wide Web (Web) - це мережа інформаційних ресурсів. Для того, щоб зробити ці ресурси доступними найбільш широкої аудиторії, в Web використовуються три механізми:

  1. Єдина схема найменування для пошуку ресурсів в Web (наприклад, URI).
  2. Протоколи для доступу до іменованих ресурсів через Web (наприклад, HTTP).
  3. Гіпертекст для простого переміщення по ресурсах (наприклад, HTML).

Зв'язки між цими трьома механізмами стають очевидними після прочитання цієї специфікації.

2.1.1 Введення в URI

Кожен ресурс в Web - документ HTML, зображення, відеокліп, програма і т.д. - Має адресу, який може бути закодований за допомогою універсального ідентифікатора ресурсів (Universal Resource Identifier) , або URI.

URI зазвичай складаються з трьох частин:

  1. Схема найменування механізму, використовуваного для доступу до ресурсу.
  2. Ім'я машини, на якій розташовується ресурс.
  3. Ім'я власне ресурсу, зачданное у вигляді шляху.

Розгляньте URI цієї специфікації HTML на сервері W3C:

  http://www.w3.org/TR/PR-html4/cover.shtml

Цей URI може читатися наступним чином: цей документ можна отримати по протоколу HTTP (див. [RFC2068] ), він розташовується на машині www.w3.org, шлях до цього документа - "/TR/PR-html4/cover.shtml". Крім того, в документах в форматі HTML Ви можете побачити схеми "mailto" для електронної пошти і "ftp" для протоколу FTP.

Ось ще один приклад URI. Він відноситься до поштової скриньки користувача:

  ... текст ... Коментарі відправляйте <A href="mailto:[email protected]"> Джо Кулу </A>.

Примітка. Більшість читачів вже знайоме з терміном "URL" , але не знає терміна "URI". URL утворюють підмножину більш загальної схеми найменування URI.

2.1.2 Ідентифікатори фрагментів

Деякі URI вказують на місце розташування всередині ресурсу. Цей тип URI закінчується символом "#", за яким слід покажчик ( ідентифікатор фрагмента ). Наприклад, наступний URI вказує на фрагмент з ім'ям section_2:

 http://somesite.com/html/top.shtml#section_2

2.1.3 Відносні URI

Відносний URI не містить інформації про схему найменування. Шлях в ньому вказує на ресурс на машині, на якій знаходиться поточний документ. Відносні URI можуть містити компоненти відносного шляху (наприклад, ".." означає один рівень вище в ієрархії) і ідентифікатори фрагментів .

Відносні URI наводяться до повних URI за допомогою базового URI. Як приклад приведення відносного URI припустимо, що у нас є базовий URI "http://www.acme.com/support/intro.shtml". Відносний URI в наступним посиланням:

  <A Href="suppliers.shtml"> Suppliers </A>

буде перетворений в повний URI "http://www.acme.com/support/suppliers.shtml", а відносний URI в наступному фрагменті

  <IMG src = "../ icons / logo.gif" alt = "logo">

буде перетворений в повний URI "http://www.acme.com/icons/logo.gif".

В HTML URI використовуються для:

  • посилання на інші документи або ресурси (див. елементи A і LINK ).
  • посилання на зовнішні таблиці стилів або скрипти (див. елементи LINK і SCRIPT ).
  • включення в сторінку зображень, об'єктів або аплетів (див. елементи IMG , OBJECT , APPLET і INPUT ).
  • створення зображень-карт (див. елементи MAP і AREA ).
  • відправки форм (див. FORM ).
  • створення документів з використанням кадрів (див. елементи FRAME і IFRAME ).
  • посилань на зовнішні джерела (див. елементи Q , BLOCKQUOTE , INS і DEL ).
  • посилань на угоди про метаданих, що описують документ (див. елемент HEAD ).

Детальніше про URI см. В розділі про типах URI .

2.2 Що таке HTML?

Щоб уявити інформацію для глобального використання, потрібен універсальний мову, яку розуміли б все комп'ютери. Мовою публікації, використовуваним в World Wide Web, є HTML (HyperText Markup Language - мова розмітки гіпертекстів).

HTML дає авторам кошти для:

  • публікації електронних документів з заголовками, текстом, таблицями, списками, фотографіями і т.д.
  • завантаження електронної інформації за допомогою клацання миші на гіпертекстовому посиланню.
  • розробки форм для виконання транзакцій з віддаленими службами, для використання в пошуку інформації, резервуванні, замовленні продуктів і т.д.
  • включення електронних таблиць, відеокліпів, звукових фрагментів і інших додатків безпосередньо в документи.

2.2.1 Коротка історія HTML

Мова HTML був розроблений Тімом Бернерс-Лі під час його роботи в CERN і поширений браузером Mosaic, розробленим в NCSA. У 1990-х роках він домігся особливих успіхів завдяки швидкому росту Web. У цей час HTML був розширений і доповнений. У Web дуже важливо використання одних і тих же угод HTML авторами Web-сторінок і виробниками. Це стало причиною спільної роботи над специфікаціями мови HTML.

HTML 2.0 (листопад 1995 року, див. [RFC1866] ) був розроблений під егідою Internet Engineering Task Force (IETF) для впорядкування загальноприйнятих положень в кінці 1994 року. HTML + (1993) і HTML 3.0 (1995, див. [HTML30] ) - це багатші версії мови HTML. Незважаючи на те, що в звичайних дискусіях згода ніколи не було досягнуто, ці чернетки привели до прийняття ряду нових властивостей. Зусилля Робочої групи World Wide Web Consortium по HTML у впорядкуванні загальноприйнятих положень в 1996 привели до версії HTML 3.2 (січень 1997, див. [HTML32] ). Зміни по відношенню до HTML 3.2 перераховані в Додатку А

Більшість людей визнають, що документи HTML повинні працювати в різних браузерах і на різних платформах. Досягнення сумісності знижує витрати авторів, оскільки вони можуть розробляти тільки одну версію документа. В іншому випадку виникає ще більший ризик, що Web буде являти собою суміш особистих несумісних форматів, що в кінцевому рахунку призведе до зниження комерційного потенціалу Web для всіх учасників.

У кожній версії HTML робилася спроба відобразити все більше число угод між працівниками і користувачами цієї індустрії, щоб зусилля авторів не були витрачені даремно, а їх документи не стали б нечитабельним в короткий термін.

Мова HTML розроблявся з тієї точки зору, що всі типи пристроїв повинні мати можливість використовувати інформацію в Web: персональні комп'ютери з графічними дисплеями з різним дозволом і числом квітів, стільникові телефони, переносні пристрої, пристрої для виведення і введення мови, комп'ютери з високою і низькою частотою і т.д.

2.3 HTML 4.0

У HTML 4.0 вводяться механізми таблиць стилів, скриптів, кадрів, впровадження об'єктів, поліпшена підтримка різних напрямків листа і напрямки справа наліво, таблиці з великою кількістю можливостей і нові властивості форм, забезпечуючи кращі можливості доступу для людей з фізичними вадами.

2.3.1 Інтернаціоналізація

Ця версія HTML розроблена за допомогою експертів в області інтернаціоналізації, так що документи можна писати на будь-якій мові і легко передавати їх по всьому світу. Це досягається за рахунок використання [RFC2070] , що відноситься до інтернаціоналізації HTML.

Важливим кроком стало прийняття стандарту ISO / IEC: 10646 (див. [ISO10646] ) як набір символів для документів HTML. Це найбільш змістовний стандарт у світі, в якому вирішені питання представлення національних символів, надсилання листа, пунктуації та інших мовних питань.

HTML тепер надає кращу підтримку різних мов в одному документі. Це забезпечує більш ефективне індексування документів для пошукових машин, друкарню вищої якості, перетворення тексту в мову, більш зручні переноси і т.д.

2.3.2 Доступність

Оскільки спільнота Web росте, і можливості та вміння його членів різняться, дуже важливо, щоб основні технології відповідали потребам. Мова HTML розроблений так, щоб зробити Web-сторінки більш доступними для користувачів з фізичними вадами. У HTML 4.0 є такі доповнення, продиктовані міркуваннями доступності:

  • посилено поділ структури і представлення документа, що спонукає використовувати таблиці стилів замість елементів і атрибутів подання мови HTML.
  • поліпшені форми, включена можливість призначення клавіш доступу, можливість семантичної угруповання керуючих елементів форми, семантичної угруповання варіантів в тезі SELECT і активні мітки.
  • додана можливість розмітки текстового опису включеного об'єкта (за допомогою елемента OBJECT ).
  • введений новий механізм дії зображень-карт на стороні клієнта (елемент MAP ), який дозволяє авторам інтегрувати зображення і текстові посилання.
  • альтернативний текст для зображень, що включаються за допомогою елемента IMG , обов'язковий.
  • додана підтримка атрибутів title і lang у всіх елементах.
  • додана підтримка елементів ABBR і ACRONYM .
  • ширший діапазон цільових пристроїв (телетайп, шрифт Бройля і т.д.) для використання в таблицях стилів.
  • поліпшені таблиці, включена підтримка заголовків, груп стовпців і механізмів для спрощення невізуальних уявлення документа.
  • додані довгі описи таблиць, зображень, кадрів і т.д.

Автори, які розробляють сторінки з урахуванням доступності, отримають не тільки цю можливість, але також і деякі інші: добре розроблені документи HTML з розділеними структурою і поданням будуть легше адаптуватися до нових технологій.

Примітка. Детальніше про розробку доступних документів HTML Ви можете прочитати в [WAIGUIDE] .

2.3.3 Таблиці

Нова модель таблиць в HTML заснована на [RFC1942] . Тепер автори мають велику владу над структурою і компонуванням таблиці (наприклад, групи стовпців). Можливість дизайнерів рекомендувати ширину стовпців дозволяє агентам користувачів відображати дані таблиці поступово (у міру отримання) і не чекати всю таблицю до створення зображення.

Примітка. Під час написання цього документа деякі засоби розробки документів в форматі HTML широко використовували для форматування сторінок таблиці , що викликало проблеми сумісності.

2.3.4 Складові документи

В HTML тепер є стандартний механізм для впровадження об'єктів і додатків до документів HTML. Елемент OBJECT (а також більш специфічні елементи, його наступники, IMG і APPLET ) забезпечує механізм включення в документ зображень, відеофайлів, звукових файлів, математичних виразів, спеціалізованих додатків і інших об'єктів. Він також дозволяє авторам вказувати ієрархію або альтернативний спосіб створення зображення для агентів користувачів, які не підтримують зазначений спосіб створення зображення.

2.3.5 Таблиці стилів

Таблиці стилів спрощують розмітку HTML і істотно знижують участь мови HTML в поданні документа. Вони надають як авторам, так і користувачам можливість керувати поданням документів - шрифтами, вирівнюванням, квітами і т.д.

Інформацію про стиль можна вказати для окремих елементів або груп елементів, в документі HTML або в зовнішніх таблицях стилів.

Механізми зв'язку таблиць стилів з документами не залежать від мови таблиць стилів.

До появи таблиць стилів можливості управління виробництвом зображення у авторів були обмежені. У HTML 3.2 був включений ряд атрибутів і елементів для управління вирівнюванням, розміром шрифту і кольором тексту. Автори також використовували для компонування сторінок таблиці і зображення. Оскільки на оновлення браузерів у користувачів піде досить довгий час, ці кошти ще будуть використовуватися протягом якогось часу. Однак оскільки таблиці стилів забезпечують більш потужні механізми уявлення, World Wide Web Consortium істотно скоротить число елементів і атрибутів подання в HTML. У цій специфікації елементи і атрибути, які можуть бути згодом виключені, позначені як " небажані ". Вони супроводжуються прикладами полдостіженія того ж ефекту за допомогою інших елементів або таблиць стилів.

2.3.6 Скрипти

За допомогою скриптів автори можуть створювати динамічні Web-сторінки (наприклад, "інтелектуальні форми", що змінюються в міру заповнення їх користувачем) і використовувати HTML як засіб побудови мережевих додатків.

Механізми, що забезпечують включення скриптів в документи HTML, які не залежать від мови скриптів.

2.3.7 Друк

Іноді автори хочуть спростити для користувачів друк поточного документа. Якщо документ є частиною іншого документа, відносини між ними можна описати за допомогою елемента HTML LINK або мови опису ресурсів (Resource Description Language - RDF) W3C (див. [RDF] ).

2.4 Створення документів у форматі HTML 4.0

Авторам і розробникам для роботи з HTML 4.0 рекомендується ознайомитися з наступними загальними принципами .

2.4.1 Поділ структури та подання

HTML відбувається з SGML, який завжди був мовою визначення структурної розмітки. У міру розвитку HTML все більшу кількість його елементів і атрибутів для подання замінюється іншими механізмами, зокрема, таблицями стилів. Досвід показує, що відділення структури документа від аспектів його уявлення знижує вартість обслуговування широкого діапазону платформ, носіїв і т.д. і спрощує зміна документів.

2.4.2 Універсальність доступу до Web

Щоб зробити свій Web-сервер доступним для всіх користувачів, особливо для користувачів з фізичними вадами, автори повинні припускати, як їх документи можуть відображатися на різних платформах: мовних браузерах, програмах читання абетки Бройля і т.д. Ми не рекомендуємо авторам обмежувати творчий процес, але рекомендуємо передбачати альтернативні методи подачі інформації. HTML пропонує ряд таких механізмів (наприклад, атрибут alt , атрибут accesskey і т.д.)

Авторам також слід мати на увазі, що до їх документів можуть звертатися користувачі з іншою конфігурацією комп'ютерів. Для коректної інтерпретації документів авторам слід включати в свої документи інформацію про мову і направлення листа в тексті, про кодування документа та іншу подібну інформацію.

2.4.3 Допомога агентам користувачів в послідовному створенні зображень

При ретельній розробці таблиць і використанні нових можливостей HTML 4.0 автори можуть прискорити відображення документів агентами користувачів. Автори можуть прочитати тут про те, як створювати таблиці для послідовного подання (див. Елемент TABLE ). Розробники можуть отримати інформацію про алгоритми послідовного уявлення в зауваженнях про таблиці в додатку.