网站使用帮助
什么是 Unicode?
Unicode 是一种字符编码标准,旨在为世界上所有语言的字符提供唯一的数字标识。
Unicode 的特点:
- 统一编码:为全球所有语言的字符分配唯一的编码点
- 兼容性:向下兼容 ASCII 编码
- 扩展性:支持超过 100 万个字符编码点
- 国际化:支持中文、日文、韩文、阿拉伯文等多种语言
Unicode 编码形式:
- UTF-8:可变长度编码,ASCII字符使用1字节,中文通常使用3字节
- UTF-16:使用2或4字节编码,适合主要使用BMP字符的场景
- UTF-32:固定4字节编码,直接存储码点值
常见用途:
- 网页编码:HTML页面通常使用UTF-8编码
- 文件存储:文本文件的标准编码格式
- 程序开发:源代码和字符串处理
- 数据传输:确保跨平台字符正确显示