python爬虫学习之爬取全国各省市县级城市邮政编码

您所在的位置:网站首页 全国邮政编码官网查询 python爬虫学习之爬取全国各省市县级城市邮政编码

python爬虫学习之爬取全国各省市县级城市邮政编码

2024-05-31 17:31| 来源: 网络整理| 查看: 265

实例需求:运用python语言在ip查询 查ip 网站ip查询 同ip网站查询 iP反查域名 iP查域名 同ip域名网站爬取全国各个省市县级城市的邮政编码,并且保存在excel文件中

实例环境:python3.7        requests库(内置的python库,无需手动安装)        xlwt库(需要自己手动安装)

实例网站:

   第一步,在ip查询 查ip 网站ip查询 同ip网站查询 iP反查域名 iP查域名 同ip域名网站通过查询源代码可以找到各个省份的链接

     第二步,点击链接,即可看到所点击省份的城市的邮政编码

实例代码:    

import requests import xlwt # 返回一个字典,键是各个省份的名字,值是对应省份的网址url def getProvinceCode(url): response = requests.get(url) response.encoding = response.apparent_encoding content = response.text start = content.find('') + len('') + len("\n") end = content.find('') mapStr = content[start:end] #print(mapStr) lines = mapStr.split("\n") baseUrl = 'http://www.ip138.com/' city_urls = [] city_name = [] for line in lines: if line: index1 = line.find('href="/') + len('href="/') index2 = line.find('/"') code = line[index1:index2] url = baseUrl + code city_urls.append(url) title1 = line.find('title="')+len('title="') title2 = line.find('"', title1) title = line[title1:title2] city_name.append(title) dict_prov_url = dict(zip(city_name,city_urls)) for item in dict_prov_url.items(): # 显示各个省份名称和对应的url print(item) return dict_prov_url # 根据url得到省份的各个城市的城市名、邮政编码以及长途区号,返回一个二维的列表。 def getPostCode(url): response = requests.get(url) response.encoding = response.apparent_encoding content = response.text start = content.find('长途区号') + len("长途区号") end = content.find('', start) add_post = content[start:end] posts = add_post.strip().split('') # posts为每一个去掉组成的列表 code_list = [] for post in posts: if post: lines = post.strip().split('')+len('>'):lines[1].find(''):lines[2].find(''):lines[3].find(''):lines[2].find(''):lines[3].find('')+len('>'):lines[1].find(''):lines[2].find(''):lines[3].find('')+len('>'):lines[4].find(''):lines[5].find(''):lines[6].find('


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3