当前位置:网站首页>ASCII、Unicode和UTF-8
ASCII、Unicode和UTF-8
2022-08-10 21:48:00 【TABE_】
标准ASCII码
标准ASCII码也叫基础ASCII码,使用7位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母、数字0到9、标点符号以及在美式英语中使用的特殊控制字符。
ASCII码只是用了7位二进制数,用一个字节表示时,它第一位总是为0。如果只表示英文,一个字节是够用的,但要表示世界上所有的文字,必须使用多个字节才行。
Unicode
Unicode就是为了能在计算机中表示所有的文字。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。需要注意的是,Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。
UTF-8
UTF-8就是在互联网上使用最广的一种unicode的实现方式。UTF-8是一种变长的编码方式,它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。
UTF-8编码规则:
- 对于单个字节的字符,第一位设为 0,后面的 7 位对应这个字符的 Unicode 码点。因此,对于英文中的 0 - 127 号字符,与 ASCII 码完全相同。这意味着 ASCII 码那个年代的文档用 UTF-8 编码打开完全没有问题。
- 对于需要使用 N 个字节来表示的字符(N > 1),第一个字节的前 N 位都设为 1,第 N + 1 位设为0,剩余的 N - 1 个字节的前两位都设位 10,剩下的二进制位则使用这个字符的 Unicode 码点来填充。
边栏推荐
- 基于Pix4Dmapper的运动结构恢复法无人机影像三维模型重建
- Black cats take you learn Makefile article 13: a Makefile collection compile problem
- 2022年8月的10篇论文推荐
- Likou 221 questions, the largest square
- 阿里云架构师金云龙:基于云XR平台的视觉计算应用部署
- An article to teach you a quick start and basic explanation of Pytest, be sure to read
- Play RT-THREAD of doxygen
- LeetCode每日一题(1573. Number of Ways to Split a String)
- 谁是边缘计算服务的采购者?是这六个关键角色
- unusual understanding
猜你喜欢
Shell programming specification and variables
【开源教程5】疯壳·开源编队无人机-飞控固件烧写
财务年报怎样翻译,为什么要选择专业翻译公司?
企业云存储日常运行维护实践经验分享
FPGA - 7系列 FPGA内部结构之Memory Resources -03- 内置纠错功能
LeetCode-402-移掉K位数字
【PCBA方案】电子握力测试仪方案she‘ji
Shell 编程--Sed
LeetCode-498 - Diagonal Traversal
Live Classroom System 08 Supplement - Tencent Cloud Object Storage and Course Classification Management
随机推荐
QT笔记——用VS + qt 生成dll 和 调用生成的dll
Thread State 详解
【PCBA scheme design】Bluetooth skipping scheme
ArcMap创建镶嵌数据集、导入栅格图像并修改像元数值显示范围
特别的三杯鸡
服务——DHCP原理与配置
LeetCode-36-二叉搜索树与双向链表
Live Classroom System 08 Supplement - Tencent Cloud Object Storage and Course Classification Management
VLAN huawei 三种模式
What are the concepts, purposes, processes, and testing methods of interface testing?
C # Hex file transfer skills necessary article 】 【 bin file code implementation
[Maui official version] Create a cross-platform Maui program, as well as the implementation and demonstration of dependency injection and MVVM two-way binding
shell脚本循环语句for、while语句
FPGA - 7系列 FPGA内部结构之Memory Resources -03- 内置纠错功能
财务年报怎样翻译,为什么要选择专业翻译公司?
爬虫request.get()出现错误
论文解读(g-U-Nets)《Graph U-Nets》
艺术与科技的狂欢,阿那亚2022砂之盒沉浸艺术季
Service - DHCP principle and configuration
过滤器