Esquema de codificación UTF-8

  • Puntos 0 a 7F: un octeto y tal cual.

  • Puntos mayores que 7F: como secuencias de 80-FD: elimina problemas de fin de cadena, sistema operativo, sincronización.

  • Preserva orden de UCS.

  • C0 a FD comienzan secuencia multiocteto: determinan longitud.

  • El resto son siempre de 80 a BF.

  • Representación (la más corta posible).

  • FE y FF no se usan.