Nota: Este documento es parte de una traducción al castellano de la Recomendación del W3C "HTML 4.01 Specification" (más información). Puede consultar la versión original del mismo. Para cualquier comentario o corrección acerca de la traducción póngase en contacto con el traductor en jrpozo@conclase.net. Gracias por su colaboración.
En este capítulo hablamos sobre cómo se representan los documentos HTML en una computadora y en Internet.
La sección sobre el conjunto de caracteres del documento trata la cuestión de qué caracteres abstractos pueden formar parte de un documento HTML. Estos caracteres incluyen la letra latina "A", la letra cirílica "I", el carácter chino que significa "agua", etc.
La sección sobre las codificaciones de caracteres trata la cuestión de cómo pueden representarse esos caracteres en un fichero o cuando se transmiten por Internet. Como algunas codificaciones de caracteres no pueden representar directamente todos los caracteres que un autor puede querer incluir en un documento, HTML ofrece otros mecanismos, llamados referencias de caracteres, para hacer referencia a cualquier carácter. Al haber un gran número de caracteres en todos los lenguajes humanos, y una gran variedad de formas de representar estos caracteres, debe tenerse un cuidado especial para que los documentos puedan ser entendidos por agentes de usuario de todo el mundo.
http://html.conclase.net/w3c/html401_es/charset.html (1 de 7) [11/6/2001 4.49.01]