美文网首页
Unicode与utf-8那些事儿

Unicode与utf-8那些事儿

作者: ZenCabin | 来源:发表于2018-07-28 12:50 被阅读11次

什么是Unicode?

Unicode是一种旨在将一切字符编码到同一个编码体系的字符集规范,【官网链接】。Unicode给每一个字形一个独立的表示,叫做码点(code point),码点一般写作"U+xxxx",xxxx表示16进制的数字,例:U+54C8(汉字“哈”)。用途或意思相近的码点被划分到一个组里,叫做平面(plane),目前一共规定了17个平面,只有少数几个被使用到了。17个平面目前的分布为:

  • 0号平面:基本面BMP
  • 1号平面:补充平面SMP
  • 2号平面:表意补充SIP
  • 3-13号平面:预备使用TIP
  • 14号平面:特殊补充SSP
  • 15-16号平面:用户自定义区
Unicode planes and used code point ranges(维基百科)

截止到Unicode 10.0,一共规定了136,690个不重复字符。

unicode 11.0字符分配表


unicode11_assigned_characters.png

什么是utf-8?

TODO xxx
utf-8是一种字符编码方式,是Unicode标准规范的一种实现。

相关文章

  • Unicode与utf-8那些事儿

    什么是Unicode? Unicode是一种旨在将一切字符编码到同一个编码体系的字符集规范,【官网链接】。Unic...

  • unicode, utf8/16, codepoint, big

    big/small endian ASCII,Unicode和UTF-8 unicode、codepoint

  • 中文处理

    从几个例子说说 Erlang 如何处理中文. 知识介绍:Unicode与UTF-8的区别,简单来说,Unicode...

  • ASCII,Unicode,UTF-8,Base-64

    字符编码笔记:ASCII,Unicode和UTF-8字符编码笔记:ASCII、Unicode、UTF-8 和 Ba...

  • Unicode与Utf-8的那些事

    1、起源 计算机起源于美国,当时所需要用到的字符比较单一,基本是英文字符和数字及其他一些符号。计算机的数据存储及运...

  • python基础-13-史上最通俗易懂的编码讲解

    常用编码 ascii unicode utf-8 gbk 编码 ascii unicode utf-...

  • 关于编码二三事

    1.中文编码共有3种,unicode, utf-8, gb2312。虽然unicode和utf-8比较像,但是我们...

  • 搞定编码格式问题

    Unicode 于 utf-8 以下文章来自知乎回答 Unicode 是「字符集」UTF-8 是「编码规则」 其中...

  • Unicode与UTF-8

    Unicode Unicode是一个国际标准,用于文本的编码和表示。它使得可以用标准格式来表示来自任意语言的几乎所...

  • unicode 与 utf-8

    1. wikipedia 重点看章节1.2 Architecture and terminology 2. 仔细读...

网友评论

      本文标题:Unicode与utf-8那些事儿

      本文链接:https://www.haomeiwen.com/subject/oolomftx.html