国产精品主播一区二区-国产一级不卡毛片-日本少妇中出-国产视频第二页-青草精品视频-亚洲熟妇丰满多毛xxxx-日韩福利在线-成年人免费观看在线视频-久久久www-91在线视频观看无毒不卡-999国产精品-91久久爽久久爽爽久久片-和搜子居同的日子2hd高清看-鬼眼 电影-中文在线精品-综合网久久-国产精品美女久久久久久

突破反爬蟲的利器——開源動態(tài)ip池

突破反爬蟲的常用方法是使用代理ip。對于初學(xué)者或個人來說,購買一些代理ip的成本略高。因此,最近編寫了一個開源項目IPProxys,為個人提供代理IP。
 
IpProxys原理:通過抓取各大代理網(wǎng)站提供的免費代理ip,進(jìn)行去重,驗證ip的可用性,將有效IP存儲在sqlite中,為爬蟲獲取IP提供HTTP接口。
 
IPProxys項目已經(jīng)上傳到github,鏈接是https://github.com/qiyeboy/IPProxys.以下是整個項目的描述。
 
Api包:主要實現(xiàn)http服務(wù)器,提供api接口(通過get請求返回json數(shù)據(jù))。
 
數(shù)據(jù)文件夾:主要指數(shù)據(jù)庫文件和qqwry.dat的存儲位置(可以查詢ip的地理位置)。
 
Db包:主要封裝一些數(shù)據(jù)庫操作。
 
蜘蛛包是爬蟲的核心功能,在代理網(wǎng)站上抓取代理ip。
 
測試包:測試一些用例,不參與整個項目的運行。
 
Util包:提供一些工具類。其中ipAddress.py查詢IP的地理位置。
 
驗證包:用于測試ip地址是否可用。
 
Config.py:主要是配置信息(包括配置ip地址的解析方法和數(shù)據(jù)庫的配置)。
 
整個項目代碼量很小,大家可以根據(jù)自己的需要進(jìn)行修改,也可以提出自己的想法和建議,幫助我完善這個項目。
 
如何使用IPProxys項目?
 
1.將項目目錄克隆到當(dāng)前文件夾。
 
$ git克隆
 
2.切換項目目錄。
 
$ cd IPProxys
 
3.運行腳本。
 
python IPProxys.py
 
窗口運行效果如下圖所示:
 
 
項目依賴關(guān)系:
 
需要安裝Sqlite數(shù)據(jù)庫。
 
安裝請求庫:pip安裝請求。
 
install lxml:apt-get install python-lxml。
 
ipProxys運行時,外部爬蟲如何獲取IP?
 
外部爬蟲只需要向IPProxys所在主機(jī)的端口8000發(fā)送GET請求。獲取請求的參數(shù)
 
動態(tài)IP模擬器
 
 
 
 
葫芦岛市| 定州市| 当阳市| 赤水市| 兰坪| 宁强县| 万源市| 临高县| 道孚县| 泗水县| 平泉县| 建德市| 醴陵市| 务川| 从化市| 凉山| 宝山区| 宜君县| 本溪市| 邵阳市| 凤山市| 介休市| 红安县| 清苑县| 三门县| 循化| 民乐县| 贵州省| 密云县| 海门市| 永川市| 涞水县| 东平县| 广丰县| 吉水县| 岱山县| 项城市| 延川县| 墨玉县| 澄江县| 南开区|