你知道 { python文本文件的编码格式 } 吗? |
|
作者:佚名 文章来源:本站原创 点击数: 更新时间:2022/12/5 3:31:37 | 【字体:小 大】 |
房屋系统文本文件存储的内容是基于字符编码的文件,常见的编码有ASCII、UNICODE等
ASCII编码可以说是最古老的编码了,是因为计算机最早是美国人发明的,美国人为了在计算机中使用自己的英语就制定了ASCII编码。
ASCCI编码只有256个字符,虽然可以涵盖26个英文,但是汉子有数以万计的字符,ASCII编码并不能满足我们,因此UNICODE编码诞生。
1、在python2.x文件的第一行增加以下代码,解释器会以UTF-8编码来处理Python文件
问题:在python2.x中,即使指定了文件使用UTF-8的编码格式,但是在遍历字符串时,仍然会以字节为单位遍历字符串
答:要能够正确的遍历字符串,在定义字符串时,需要在字符串的引导前增加一个小写字母u,告诉解释器这事一个unicode字符串(是使用UTF-8编码更是的字符串)
Python3.X 源码文件默认使用utf-8编码,所以可以正常解析中文,无需指定 UTF-8 编码。
基础入门到逐步深入 适合新手入门到精通 体系课程:Web开发、爬虫、图形界面化、自动化(运维、测试)、云计算返回搜狐,查看更多
|
|