用 urllib 的 urljoin() 拼接两个网址
对于urljoin()
,第一个参数是基础母站的url,第二个是需要拼接成绝对路径的url。即使后者完全没有前者的内容,也可以。
Python 3.5.3 (v3.5.3:1880cb95a742, Jan 16 2017, 08:49:46) [GCC 4.2.1 (Apple Inc. build 5666) (dot 3)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> from urllib import parse>>> url1 = "http://www.youtube.com/user/khanacademy">>> url2 = "/user/khanacademy">>> parse.urljoin(url1,url2)'http://www.youtube.com/user/khanacademy'>>> url1 = "http://www.youtube.com/">>> parse.urljoin(url1,url2)'http://www.youtube.com/user/khanacademy'
如果url2,是一个完整的url,则以后者的为准,所以,不管url2是不是短连接,都可以放进去拼接。
>>> url2 = "http://www.youtube.com/user/khanacademy">>> parse.urljoin(url1,url2)'http://www.youtube.com/user/khanacademy'>>> url2 = "http://d.com/user/khanacademy">>> parse.urljoin(url1,url2)'http://d.com/user/khanacademy'
文章转载于:https://www.jianshu.com/p/20065f9b39bb
原著是一个有趣的人,若有侵权,请通知删除
还没有人抢沙发呢~