美文网首页
简书备份(导出)所有文章和图片的方法

简书备份(导出)所有文章和图片的方法

作者: 张云飞Vir | 来源:发表于2019-11-05 17:59 被阅读0次

1.场景:

我在简书写了很多文章,考虑到文章的安全性,我希望定期备份下载我的文章,那么该怎么做呢?

2.整体思路

2.1.问题分解及实现思路

  1. 下载所有文章: 采用官方提供
  2. 下载所有图片:写个python脚本

3.操作步骤

3.1.设备环境

  • 我的简书文章使用的 markdown 格式
  • 电脑安装 Python 环境

3.2.第一步:下载所有文章

登录到简书 -> 点击个人头像 -> 选择设置 -> 账号管理 -> 点击 下载所有文章

按下图操作


image.png

下载后的样子


image.png

3.3.第二步:写个python脚本

分解一些操作:

  • 遍历文件夹和文件
  • 打开文件,逐行读取
  • 识别检索图片的描述符号,获得图片url,下载。

python 遍历文件夹

  for root, dirs, files in os.walk(dir_name):

python 遍历文件夹

  for root, dirs, files in os.walk(dir_name):

python 逐行读文件

f = open(a_markdown_file)
line = f.readline()
i = 0
while 1:
    line = f.readline()
    if not line:
        break
    i = i + 1
    ln = line[:-1]
    # print("[{}] [{}]".format(i, ln))
    process_line(ln, output_dir)
f.close()

markdowni的图片描述是下面这样样子,我们需要个正则表达式。

![image.png](https://img.haomeiwen.com/i2044033/48c2eae384fc250c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

使用这个正则:

    img_list = re.findall(r"\!\[[^\]]*\]\((.+?)\)", line, re.S)

4.完整的 python 脚本:

我托管到GIthub,点击:完整代码

相关文章

  • 简书备份(导出)所有文章和图片的方法

    1.场景: 我在简书写了很多文章,考虑到文章的安全性,我希望定期备份下载我的文章,那么该怎么做呢? 2.整体思路 ...

  • Python导出简书图片

    一、说明 简书前几天莫名其妙的宕机让我有些后怕,数据备份提上日程。 简书虽然有导出文章的功能,但是文章中的图片还是...

  • 圆形的事 20180225 | 简书的生成图片功能

    锤子便签导出图片时可以没有「锤子」标记呢,虽然有没有标记我并不介意。 简书导出的图片都带有简书标记,而且有作者、文...

  • 简书文章导出备份

    来到简书后写了几篇文章,然后意识到备份文章及转换成不同的格式,是一个较普遍的需求,研究了一下简书自带的导出功能较简...

  • 关于本人在简书平台发布文章、图片的说明

    本人自2017年9月进入简书平台以来,发布了一些文章和和图片,承蒙简友喜欢,特此对简书平台和所有简友表示感谢,并就...

  • 简书文章打包下载(图片本地化)

    背景:备份简书所有的文章目前简书提供了文章打包下载功能。但文章中的图片是以链接的形式存在的,并未下载到本地。因此用...

  • 小图

    线条构图越简单,导出的图片就越小?经常被简书提醒简笔画图片超过了 10 M,没想到这次 Sketch 导出的不到 ...

  • MongoDB全量备份与恢复

    备份命令 : mongodump使用mongodump命令来备份MongoDB数据,该命令可以导出所有数据到指定目...

  • 简书文章如何批量导出备份

    前言:触网十多年,网上使用过的博客等服务少说也有十来家了,但最终还是选择了自己架设。因为自己苦心或百无聊赖时写下的...

  • Mysql数据备份导出csv文件

    Mysql数据库备份 1 . 备份数据库 备份多个数据库 备份所有数据库 2 . 备份表数据 还原数据 导出数据到...

网友评论

      本文标题:简书备份(导出)所有文章和图片的方法

      本文链接:https://www.haomeiwen.com/subject/qwjsbctx.html