在线测试工具
https://tool.oschina.net/regex/
特殊字符
方法注意点
正则表达式中有存在转义的问题,比如
\t
变成制表符,所以要加r'abc'
match()
- 缺点:是从字符串起始位置匹配,只能单个进行匹配(尽量别用)
finall()
- 缺点:获取数据多个,需要进一步处理(爬虫中用的多)
小技巧
首先先把需要的源码拉出来,然后再在里面进行匹配的操作
1 | str = 'zhangsan he lisi shuo ta de shoujihao shi 12345678890' |
例子
匹配JSON字符串中的某值
百度源码中一段字符串中的protool的值
1 | { |
demo
1 | content = ''' |