正则尝试

作者: dongger | 来源:发表于2018-11-14 16:12 被阅读0次

正则尝试
正则基本尝试
Python学习路线：定义实现最短匹配的正则表达式
置过键盘要求只输入字符串和数字不能输入符号和中文
神经网络实践之正则化
正则表达式总结
正则表达式快速参考
python采集整站图片
java正则使用
regexp 正则包

主要收获

首次使用正则匹配爬取。
使用yield返回数据
利用json写入文本

import requests
import re
import json
urls=["https://www.qiushibaike.com/text/page/{}/".format (str(i)) for i in range(1,14)]
def get_one_page(url):
    web_data=requests.get(url)
    return web_data.text
def parse_one_page(html):
    content=re.compile('<h2>(.*?)</h2>.*?</div>.*?<span>(.*?)</span>.*?</div>.*?number.*?>(\d+)</i>',re.S)
    item=re.findall(content,html)
    for i in item:
        yield {
            "title":i[0].strip(),
            "article":i[1].strip().replace('<br/>','\n'),
            "funny":i[2],
        }
def write_to_file(content):
    with open('re_douban.txt','a',encoding='utf-8') as f:
        f.write(json.dumps(content,ensure_ascii=False)+'\n')

def main():
    for url in urls:
        html=get_one_page(url)
        data=parse_one_page(html)
        for i in data:
            write_to_file(i)

if __name__ == '__main__':
    main()

正则尝试
主要收获首次使用正则匹配爬取。使用yield返回数据利用json写入文本
正则基本尝试
正则创建：方式一：字面量创建（常用）方式二：构造函数创建正则匹配方法：一、正则方法1.test 2.exe...
Python学习路线：定义实现最短匹配的正则表达式
Python学习路线：定义实现最短匹配的正则表达式 1、需求我们正在尝试用正则表达式对文本模式做匹配，但识别出来...
置过键盘要求只输入字符串和数字不能输入符号和中文
NSPredicate这个类正则表达式以上两个方法具体没尝试呢，先做个记录。
神经网络实践之正则化
前言在机器学习的应用层面中，已经了解了神经网络中的一些有关实践层面的正则化方法，本篇文章将会尝试利用各种正则化方...
正则表达式总结
正则表达式之所以这么难以理解也许就是因为它所描述的东西本身十分抽象。以下，我将尝试以我目前的见识水平总结一下对正则...
正则表达式快速参考
正则表达式是正则表达式引擎尝试匹配输入文本的一种模式。模式由一个或多个字符文本、运算符或构造组成。有关简要介绍...
python采集整站图片
记录学习Python历程简单了解语法规则，尝试利用正则采集网站图片，结果还算理想，不过只写了手动查询的，自动采集...
java正则使用
正则切割正则捕获正则完全匹配
regexp 正则包
正则对象正则使用都是通过创建对应的正则对象，调用对象方法所实现。新建正则对象正则对象属性方法正则方法一般...

网友评论

本文标题：正则尝试

本文链接：https://www.haomeiwen.com/subject/blujfqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

正则尝试

主要收获

相关文章

正则尝试

正则基本尝试

Python学习路线：定义实现最短匹配的正则表达式

置过键盘要求只输入字符串和数字不能输入符号和中文

神经网络实践之正则化

正则表达式总结

正则表达式快速参考

python采集整站图片

java正则使用

regexp 正则包

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读