python使用urlretrieve下载文件时出现403 forbidden的解决方法

2017-08-02 • Errors • 9 条评论 •9,350 人围观

出现该错误的原因是服务器开启了反爬虫，一般情况下只需要设置header模拟浏览器即可，但是urlretrieve并未提供header参数。

使用urlopen也可以直接下载文件，例

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.86 Safari/537.36"}
def down_pic(url, path):
    try:
        req = request.Request(url, headers=headers)
        data = request.urlopen(req).read()
        with open(path, 'wb') as f:
            f.write(data)
            f.close()
    except Exception as e:
        print(str(e))

还有一种解决方法：

opener=urllib.request.build_opener()
opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1941.0 Safari/537.36')]
urllib.request.install_opener(opener)
urllib.request.urlretrieve(url, Path)

9 条评论

Pingback: HTTP Error 403: Forbidden with urlretrieve - icelily's blog urlretrieve 403 - urllib 403 - python 403
南明离火 Google Chrome 76 Windows 7 2019-9-29 00:13

方法2可行，方法1没试。谢谢楼主！！！

回复
sdq Google Chrome 76 Windows 10 2019-9-19 18:53

还是不行

回复
小白 Google Chrome 55 Windows 10 2018-7-23 08:08

把文件就放在当前目录就好了放在其他位置为什么不行再研究研究

回复
小白 Google Chrome 55 Windows 10 2018-7-22 22:35

我发现网址有问题改正后能访问但是下载没有用

回复
小白 Google Chrome 55 Windows 10 2018-7-22 22:03

第一种 403 第二种没反应但也没报错

回复
Wisedeveloper Google Chrome 66 GNU/Linux 2018-7-19 08:59

我用了第二种方法不行啊,还是403

回复
1. 鸽子 Google Chrome 67 Windows 10 2018-7-19 11:38
  
  应该他们的反爬虫做的比较强，可以抓包看一下http请求头里都有什么。
  
  回复
匿名 Google Chrome 55 Windows 7 2018-3-26 23:56

神了

回复