编码字符集(CCS:Coded Character Set):是将字符集中每个字符映射到1个坐标(整数值对:x, y)或者表示为1个非负整数 。字符集及码位映射称为编码字符集 。例如,在一个给定的字符表中,表示大写拉丁字母“A”的字符被赋予整数65、字符“B”是66,如此继续下去 。
简单来说这就是一个映射关系表,将一串码值映射到抽象字符表里的特定字符 。字符编码表(CEF:Character Encoding Form):该层也称为”storage format” 。对于一个包含几乎全球语言的字符集 。比如Unicode字符集最多可以2的31次方个字符,用4个字节来存储一个 。
但是真的有必要在时时刻刻都使用4个字节来记录一个字符吗?很显然不是这样 。比如拉丁字母“A”实际上需要二进制码01000001一个字节就可以表示 。于是需要一种类似于压缩方式的方法,来尽量用最少空间存储不同种类字符的方式比如后面会提到的UTF 。所以这一层主要是描述字符编码所能采用的编码格式 。
字符编码方案(CES:Character Encoding Scheme):也称作”serialization format”,将定长的整型值(即码元)映射到8位字节序列,以便编码后的数据的文件存储或网络传输 。传输编码语法(transfer encoding syntax):用于处理上一层次的字符编码方案,提供的字节序列 。一般其功能包括两种:一种是把字节序列的值映射到一套更受限制的值域内,以满足传输环境的限制,例如Email传输时 ba
- 《天盛长歌》华琼结局是什么 ?
- 苏格兰与英格兰的关系是什么?
- 工程机是什么意思?
- 《十二国记》的结局是什么?
- qcc是什么意思?
- abs塑料是什么材质?
- 仪表盘显示感叹号是什么意思
- 想知道倭瓜花是什么?
- kimi是什么意思?
- "虚心竹有低头叶,傲骨梅无仰面花"是什么意思?