Difference between revisions of "BOM"

From SunFlurry wiki
Jump to: navigation, search
 
m (1 revision imported)
 
(No difference)

Latest revision as of 08:43, 7 February 2021

BOM (Byte order mark) -- маркировка типа кодировки, состоящая из двух или более байт, идущая в начале текстового файла (или строки). Такие комбинации символов не должны быть перекодированы, так как они не являются частью текста, а обозначают его кодировку. Если перекодировать, к примеру, текст из UTF-16, включающий два байта BOM, в UTF-8, BOM будет перекодирован как "?", так как он не имеет закрепленного за ним символа. См. также Строки.

BOM некоторых кодировок:

  • UTF-16-LE (стандартный UTF-16): Chr(255,1)+Chr(254,1)
  • UTF-16-BE (байты стандартного UTF-16 переставлены местами): Chr(254,1)+Chr(255,1)
  • UTF-8: Chr(239,1)+Chr(187,1)+Chr(191,1)