rwhn.net
当前位置:首页 >> python urlDECoDE >>

python urlDECoDE

url编码: import urllib url = 'http://test.com/s?wd=哈哈' #如果此网站编码是gbk的话,需要进行解码,从gbk解码成unicode,再从Unicode编码编码为utf-8格式。 url = url.decode('gbk', 'replace') print urllib.quote(url.encode('utf-8', 'r...

根据官方文档: string urlencode(string $str)此函数便于将字符串编码并将其用于 URL 的请求部分,同时它还便于将变量传递给下一页。 返回字符串,此字符...

ubuntu 的控制台默认是utf8编码的吧。而且这个google返回的是big5编码吗,用下面的代码解码下试试 url="网址" content = urllib2.urlopen(url).read() print content.decode('big5').encode('utf8')

python默认就是unicode存储。如果是从文件读取的,在open的参数中指定encoding关键字参数就行。如下: #coding=utf-8/import json /def LoadQuestion(): /f = open("test.json",'r') qas = json.load(f) question = qas['documents'] /return qu...

你试试下面的代码 #!/usr/bin/env python# -*- coding:utf8 -*-import urllib2req = urllib2.Request("http://www.baidu.com/")res = urllib2.urlopen(req)html = res.read()res.close()html = unicode(html, "gb2312").encode("utf8")print html

一般都用requests,很少用urllib

是python 3版本吧,要用urllib.parse import urllib.parseimport urllib.requesturl = 'http://www.baidu.com/s'user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'values = {'name' : 'WHY', 'location' : 'SDU', 'language' : 'P...

网站首页 | 网站地图
All rights reserved Powered by www.rwhn.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com