爬取链家租房数据

爬取链家租房数据

    正在检查是否收录...

 使用requests+lxml结合爬取的链家租房信息数据,翻页我直接使用循环去访问的,链接翻页的改变就是相对应的'pg1'。

主要使用xpath匹配了房源名称、房源大小、地点、价格等字段信息,获取各个字段之后连接了我的本地数据库,然后一条一条从插入数据库。

数据库的连接得填好自己想要存进去的数据库账号。

就这些了,有不懂的欢迎评论,下面附上代码:

import requests from lxml import etree import pymysql import time headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.84 Safari/537.36', } def parse_lianjia_data(url): data = requests.get(url,headers=headers) response = etree.HTML(data.content) length = response.xpath("//ul[@id='house-lst']/li") print(len(length)) for i in range(len(length)): print("=========================") print(url) item = {} try: house_name = response.xpath("//li[@data-index='"+str(i)+"']//h2//text()") print(house_name) item['house_name'] = ''.join(house_name).strip() house_size = response.xpath("//li

数据库urlhtmlsqlappwindowschromeapplemozillawebparsemysql
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-18524.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

LoRA6~Stable Diffusion

上一篇

Stable Diffusion【Pony模型】【二次元模型】:质量高&画风清新&细节丰富的二次元大模型二次元插图

下一篇
  • 复制图片
按住ctrl可打开默认菜单