美文网首页
笨方法python去除收藏夹重复收藏页

笨方法python去除收藏夹重复收藏页

作者: 远or广 | 来源:发表于2019-05-17 10:03 被阅读0次

#!/usr/bin/python

# -*- coding: UTF-8 -*-

list1=[] # 最终列表

b=None

with open(r"D:\Desktop\bookmarks.html",'r',encoding='utf-8') as fh:

    for line in fh:

        # print(line.strip())

        # print(type(line))

        # print(line.split())

        f=line.strip()

        a=f.split('>')

        if len(a) <3: # 切片后长度小于3就是普通标签直接添加,否则就是收藏夹要去重复

            list1.append(f)

        elif a[-2] != b:

            list1.append(f)

            b = a[-2]

            # print(b)

with open(r"d:\Desktop\new_html.html",'w',encoding='utf-8') as f:

    for i in list1:

        f.write(i)

        f.write('\n')

相关文章

网友评论

      本文标题:笨方法python去除收藏夹重复收藏页

      本文链接:https://www.haomeiwen.com/subject/eycnaqtx.html