正则表达式 \\\\,百度文库爬虫最终版

1153 2023-05-23 10:57

"\\\\"字符串中,两个反斜杠被解释为一个反斜杠,再作为正则表达式, \\ 则被正则表达式引擎解释为 \,所以在正则表达式中需要使用四个反斜杠表示"\"

url_list = re.findall(r'(https:\\\\/\\\\/wkretype.bdimg.com.*?\d+)\\"', content)

替换成

url_list = re.findall(r'(https://wkretype.bdimg.com.*?\d+)"', content)

即可保存ppt中的所有图片

全部评论

·