从网页源码中过滤 img 标签,取src的图片网址,下载到本地,通过xpath将src的值改为对应的本地路径。 有时src的图片url不可用,可以使用src2或者data_src,因为有些网站为了应付爬虫,会通过js动态控制src。 [crayon-6637e59489452931029706/] -end
一。XML入门 可扩展标记语言,用于描述关系型数据。xml文件为xml后缀的文本文件。 1. 语法: 使用配对的尖括号及问号包裹xml关键字。 1)声明:使用version设置版本 <?xml version="1.0" ?> 2)编码:使用encoding设置字符集编码。同时文件保存时使用相同编码 <?xml version="1.0" encoding="utf-8" ?> 3)独立声明...