这段时间在改造之前写的的一个下载器,当时是用php实现的,现在改用python实现。因为远程文件都是以中文名字存放的,一开始用python处理起来碰到很多问题,其中最烦的就是在保存文件时对中文url的处理一直出错。最后发现用encode转换一下就可以正常支持了。

BeautifulSoup真的很好用

  1. urlstr.encode('gb2312'

本日志由 feng 于 2010-01-22 10:06:47 发表到 Programming 中,目前已经被浏览 59 次,评论 0 次;

作者添加了以下标签: python下载器中文乱码