Difference between revisions of "BOM"
m (1 revision imported) |
|
(No difference)
|
Latest revision as of 08:43, 7 February 2021
BOM (Byte order mark) -- маркировка типа кодировки, состоящая из двух или более байт, идущая в начале текстового файла (или строки). Такие комбинации символов не должны быть перекодированы, так как они не являются частью текста, а обозначают его кодировку. Если перекодировать, к примеру, текст из UTF-16, включающий два байта BOM, в UTF-8, BOM будет перекодирован как "?", так как он не имеет закрепленного за ним символа. См. также Строки.
BOM некоторых кодировок:
- UTF-16-LE (стандартный UTF-16): Chr(255,1)+Chr(254,1)
- UTF-16-BE (байты стандартного UTF-16 переставлены местами): Chr(254,1)+Chr(255,1)
- UTF-8: Chr(239,1)+Chr(187,1)+Chr(191,1)