python入门系列教程(七) 彻底搞懂字符编码二

今天是小编分享python入门教程第七讲,讲述关于python的字符串与令人头疼的

字符编码,彻底搞懂字符编码二,decode()与encode()两个方式的利用。

13python入门系列教程(七) 彻底搞懂字符编码一

东西/原料

  • python

方式/步调

  1. 1

    chardet模块功能:可以检拆字符串编码,查抄是否有该模块,报错信息提醒没有该模块

  2. 2

    若是没有该chardet模块的可以用pip install chardet安装

    以下是安装环境

  3. 3

    这两个decode()、encode()

    decode()功能:将其他编码字符转化为Unicode编码字符。 encode()功能:将Unicode编码字符转化为其他编码字符。

  4. 4

    其实乱码素质上就是当前系统编码与所供给的字符编码纷歧致导致的。接下来举一个用的比力的多的例子

    在windows系统下利用python2获取百度首页的title

  5. 5

    首页利用的字符编码是utf-8,而我们当前windows系统的默认字符编码是gbk,我们来测试一下直接提取会不会呈现乱码问题。

    import re,urllib2

    html = urllib2.urlopen('http://www.baidu.com/').read()

    title = re.findall(r'<title>(.*?)</title>',html)[0]

  6. 6

    怎么解决乱码呢?

    gbk_title = title.decode('utf-8').encode('gbk')

注重事项

  • 分享投票点赞或存眷,是对小编最年夜的鼓动勉励。感谢~
  • 发表于 2018-03-01 00:00
  • 阅读 ( 325 )
  • 分类:其他类型

相关问题

0 条评论

请先 登录 后评论