Il linguaggio standard che la Web usa per creare e decodificare documenti è l'HTML. HTML discende da SGML (Standard Generalized Markup Language), uno dei primi metodi per creare documenti formattati. Linguaggi come HTML consentono di presentare uno stesso contenuto in modi diversi: gli utenti possono scegliere tipo e grandezza dei caratteri, spaziature e altri elementi. L'HTML si è rapidamente diffuso grazie alla sua semplicità.
Tecnicamente un documento in HTML è un file in ASCII con codici di formattazione che contengono informazioni riguardanti la presentazione del documento (stili di testo, titoli, liste..) e ancore.
Attualmente sono disponibili dei convertitori che permettono di tradurre documenti da vari formati in HTML: esistono dei filtri che possono convertire files in RTF, WordPerfect, LaTex e anche files di solo testo e archivi di posta [17].