问题背景:
本来想写一个脚本来处理硬盘里的文件,并进行分类处理,但是发现一个问题,使用python内置os模块里的方法出现一些问题,具体的见示例。
主要使用的方法(python 2.7版本)
示例:
在电脑的D盘下建立两个文件夹,并在两个文件夹下分别建立两个文件及目录:
a: D:\\test\\test.txt
b: D:\测试\测试.txt
分别使用a,b路径来测试os.path的几个方法
#!/usr/bin/env python # -*- coding: utf-8 -*- import os a = "D:\\test\\test.txt" b = "D:\测试\测试.txt" print "a文件是否存在?" + str(os.path.exists(a)) print "a路径是绝对路径?" + str(os.path.isabs(a)) print "a是目录?" + str(os.path.isdir(a)) print "a是文件?" + str(os.path.isfile(a)) print "=================================" print "b文件是否存在?" + str(os.path.exists(b)) print "b路径是绝对路径?" + str(os.path.isabs(b)) print "b是目录?" + str(os.path.isdir(b)) print "b是文件?" + str(os.path.isfile(b))
执行后得到的结果是:
a文件是否存在?True a路径是绝对路径?True a是目录?False a是文件?True ================================= b文件是否存在?False b路径是绝对路径?True b是目录?False b是文件?False
我们可以预想一下,这两个路径执行后的结果应该是一致的,当然结果并不是一致的,因为什么呢?刚刚的执行结果使用的是ide,我们使用Python的交互式命令行来试试
> a = "D:\\test\\test.txt" > print "a文件是否存在?" + str(os.path.exists(a)) a文件是否存在?True > print "a路径是绝对路径?" + str(os.path.isabs(a)) a路径是绝对路径?True > print "a是目录?" + str(os.path.isdir(a)) a是目录?False > print "a是文件?" + str(os.path.isfile(a)) a是文件?True > b = "D:\测试\测试.txt" > print "b文件是否存在?" + str(os.path.exists(b)) b文件是否存在?True > print "b路径是绝对路径?" + str(os.path.isabs(b)) b路径是绝对路径?True > print "b是目录?" + str(os.path.isdir(b)) b是目录?False > print "b是文件?" + str(os.path.isfile(b)) b是文件?True
这时候就有尴尬了,这里执行的结果是一致的,所以要么是ide问题,要么是编码问题。通过实验最后证明是编码的问题
import os a = "D:\\test\\test.txt" b = u"D:\测试\测试.txt" print "a文件是否存在?" + str(os.path.exists(a)) print "a路径是绝对路径?" + str(os.path.isabs(a)) print "a是目录?" + str(os.path.isdir(a)) print "a是文件?" + str(os.path.isfile(a)) print "b文件是否存在?" + str(os.path.exists(b)) print "b路径是绝对路径?" + str(os.path.isabs(b)) print "b是目录?" + str(os.path.isdir(b)) print "b是文件?" + str(os.path.isfile(b))
执行结果
a文件是否存在?True a路径是绝对路径?True a是目录?False a是文件?True ========================== b文件是否存在?True b路径是绝对路径?True b是目录?False b是文件?True
好了,现在一致了,代码中可以看出,只是在b的路径上加了一个u(表示将字符串变成了Unicode编码的字符串了),由此可以看出在python2.7版本里中文编码问题有多么严峻,这种仅仅加u的方式肯定不行,建议使用Python的unicode方法来转化。
解决方法:
b = "D:\测试\测试.txt" b = unicode(b, 'utf-8')
总结:中文问题,应该是python2.7比较头疼的问题,3以上应该比较好,不用担心这个问题,随后在处理路径上或其他涉及中文内容的时候,不管是英文还是中文,都可以加上unicode(content, encoding)一步来确保无误,希望本文能帮到你。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。