Юникод (Unicode) — 16-разрядная система кодирования, совместимая с системой ASCII, которая охватывает символы разных письменностей: латинской, кириллической, греческой, а также языков, использующих иероглифы. Система присваивает уникальный код любому символу, независимо от платформы, программы или языка. Для представления символа используются два байта. Коды разделены на несколько областей: область с кодами от 0000 до 007F содержит символы набора Latin 1 (младшие байты соответствуют кодировке ISO 8859-1), далее идут области, в которых расположены символы различных письменностей, а также знаки пунктуации и технические символы. Часть кодов зарезервирована для применения в будущем. Символам кириллицы выделены коды в диапазоне от 0400 до 0451. Для работы с документами Unicode необходимы соответствующие шрифты. Как правило, файл шрифта Unicode содержит начертания не для всех символов, определенных в стандарте.
Стандарт Unicode предложен некоммерческой организацией Unicode Consortium, образованной в 1991 году. Его приняли ведущие компьютерные фирмы: Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys и др. Cхема кодирования используется большинством современных технологий и стандартов (например, XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML и др.). Unicode поддерживается множеством операционных систем и всеми современными браузерами Интернета. Повсеместное распространение стандарта Unicode считается одним из важных направлений развития индустрии программного обеспечения.