方案确定
- 官网/小程序/公众号破解:http
- 官网/小程序/公众号抓取:browser
- app 破解
业务需求细节确认
eg:
- 舱位
- 剩余座位数
- 机型
- 报价币种
- 报价税
- 查询人数
- 儿童价格
- 行李额
- 售罄行程处理
技术选型
Browser 类 推荐:
- webdriver + (Python|Java|.net|…)
- Puppeteer + NodeJS
其它 headless browser,排名不分前后~~
- phantomjs (http://phantomjs.org/)
- cefsharp (http://cefsharp.github.io/).net
- jsdom (https://github.com/jsdom/jsdom)
- scrapy+splash
网页解析
Chrome Webdriver
- 一定要安装对版本
http://chromedriver.chromium.org/downloads - 安装 Chrome 插件
1 |
|
- 设置代理
1 | // js |
- 启动非默认 Chrome
1 | // c++ |
Python
- bs4
- pyquery
- lxml.html
- re
1 | // `YAML |
Node
- cheerio (https://github.com/cheeriojs/cheerio)
- jquery (https://www.npmjs.com/package/jquery)
- parse5 (https://github.com/inikulin/parse5) (jsdom, Angular2, Polymer)
官网破解
工具
- charles (https://www.charlesproxy.com/)
- wireshark (https://www.wireshark.org/)
技术点
- python 里的 js 引擎
- js2py
- pyv8
产品化
- restful
- headless or not
- stability
Puppeteer 示例代码
1 | (async () => { |
I'm so cute. Please give me money.
- Post link: https://blog.gaocaipeng.com/2020/09/29/yezwd2/
- Copyright Notice: All articles in this blog are licensed under unless otherwise stated.