Python如何爬取美团美食数据


这篇文章将为大家详细讲解有关Python如何爬取美团美食数据,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1)搜索要点美团美食,地址:北京,搜索关键词:火锅2)爬取的urlhttps://bj.meituan.com/s/%E7%81%AB%E9%94%85/3)说明url会有自动编码中文功能。所以火锅二字指的就是这一串我们不认识的代码%E7%81%AB%E9%94%85。通过关键词城市的url构造,解析当前url中的bj=北京,/s/后面跟搜索关键词。这样我们就可以了解到当前url的构造。开启F12开发者工具,并且刷新当前页面:可以看到切换到第二页时候,我们的url没有变化,网站也没有自动进行刷新跳转操作。(web中ajax技术就是在保证页面不刷新,url不变化情况下进行数据加载的技术)此时我们需要在开发者工具中,找到xhr里面对应当前数据的响应文件。分析到这里可以得知:我们的数据是以json格式交互。分析第二页的json文件请求地址与第三页json文件的请求地址。第二页:https://apimobile.meituan.com/group/v4/poi/pcsearch/1?uuid=xxx&userid= 香港云主机-1&limit=32&offset=32&cateId=-1&q=%E7%81%AB%E9%94%85第三页:https://apimobile.meituan.com/group/v4/poi/pcsearch/1?uuid=xxx&userid=-1&limit=32&offset=64&cateId=-1&q=%E7%81%AB%E9%94%85对比发现:offse参数每次翻页增加32,并且limit参数是一次请求的数据量,offse是数据请求的开始元素,q是搜索关键词poi/pcsearch/1?其中的1是北京城市的id编号。接下来直接构造请求,循环访问每一页的数据,最终代码如下。运行结果如下:关于“Python如何爬取美团美食数据”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

相关推荐: JVM的CPU资源占用过高问题的排查过程是怎么样的

今天就跟大家聊聊有关JVM的CPU资源占用过高问题的排查过程是怎么样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。上午线上某应用的一台JVM的CPU占比突然飙高到192%,并且一直下不来,导致监控一直…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 08/29 11:17
下一篇 08/29 11:17

相关推荐