UTF16

Unicode 字符集、编码 相关的基本介绍

与世无争的帅哥 提交于 2019-12-07 15:06:55
作者:shede333 主页:http://my.oschina.net/shede333 && http://blog.sina.com.cn/u/1509658847 版权声明:原创文章,版权声明:自由转载-非商用-非衍生-保持署名 | [Creative Commons BY-NC-ND 3.0][] Unicode 20世纪80年代末, 位于美国加州的组织允许任何愿意支付会费的公司和个人加入,其成员包含了主要的电脑软硬件厂商,例如 奥多比系统 、 苹果公司 、 惠普 、 IBM 、 微软 、 施乐 等, 组成Unicode组织的商业机构 Unicode Consortium ,和国际合作的 国际标准化组织 IEEE 因为电脑普及和信息国际化的前提下,分别各自成立了Unicode组织 [2] 和ISO-10646工作小组。他们不久便发现对方的存在,大家为着相同的目的而工作。 1991年,Unicode Consortium与ISO/IEC JTC1/SC2同意保持Unicode码表与ISO 10646标准保持兼容并密切协调各自标准进一步的扩展。虽然实际上两者的字集编码相同,但实质上两者确实为两个不同的标准。 the Unicode Consortium 开发了 The Unicode Standard ( "Unicode" ) , 目前Unicode的最新版本为V8.0,

JavaScript: 详解Base64编码和解码

空扰寡人 提交于 2019-12-06 06:23:17
Base64是最常用的编码之一,比如开发中用于传递参数、现代浏览器中的<img />标签直接通过Base64字符串来渲染图片以及用于邮件中等等。Base64编码在RFC2045中定义,它被定义为:Base64内容传送编码被设计用来把任意序列的8位字节描述为一种不易被人直接识别的形式。 我们知道,任何数据在计算机中都是以二进制的方式存储的。一个字节为8位,一个字符在计算机中存储为一个或多个字节,比如英文字母、数字以及英文标点符号就是用一个 字节来存储的,通常称为ASCII码。而简体中文、繁体中文、日文以及韩文等都是用多字节来存储的,通常称为多字节字符。因为Base64编码是对字符串的编码表示进行处理的,不同编码的字符串的Base64的结果是不同的,所以我们需要了解基本的字符编码知识。 字符编码基础 计算机最开始只支持ASCII码,一个字符用一个字节表示,只用了低7位,最高位为0,因此总共有128个ASCII码,范围为0~127。后来为了支持多种地区的语言,各大组织机构和IT厂商开始发明它们自己的编码方案,以便弥补ASCII编码的不足,如GB2312编码、GBK编码和Big5编码等。但这些编码都只是针对局部地区或少数语言文字,没有办法表达所有的语言文字。而且这些不同的编码之间并没有任何联系,它们之间的转换需要通过查表来实现。 为了提高计算机的信息处理和交换功能