我爬的网页源码顶端写的是 <meta charset="utf-8"> 我在浏览器打开源码看到我想要的信息也是中文, 不过在urllib2.urlopen(url).read()输出来的却是类似于 陈颖 这种unicode编码 然后我使用 .encode('utf-8')也没有效果。。 请问该怎么转成中文? (我的python程序是coding:utf-8)
import HTMLParser h = HTMLParser.HTMLParser() print h.unescape("陈颖").encode("utf-8") 陈颖
欢迎来到随意问技术百科, 这是一个面向专业开发者的IT问答网站,提供途径助开发者查找IT技术方案,解决程序bug和网站运维难题等。 温馨提示:本网站禁止用户发布与IT技术无关的、粗浅的、毫无意义的或者违法国家法规的等不合理内容,谢谢支持。