美文网首页
PDF文件的读写

PDF文件的读写

作者: autumn1919 | 来源:发表于2020-04-05 17:13 被阅读0次

一个简短的Python脚本,实现对PDF文档的读写

import pdfplumber
import pandas as pd
import os
import csv

#在硬盘下新建名为data_pdf的文件夹,放入PDF文件执行即可
with open('pdf_read.csv','a+',newline='',encoding='utf-8') as csvfile:
    writer=csv.writer(csvfile,dialect='excel')
    for root, dirs, files in os.walk("./data_pdf/" ):
        for index_file,name in enumerate(files):
            try:
                if name.split('.')[1]=='pdf':
                    path=os.path.join(root, name)
                    with pdfplumber.open(path) as pdf:
                        for index,page in enumerate(pdf.pages):
                            #tables = page.extract_tables()  # 获取表格信息
                            string = page.extract_text()  # 获取PDF文本信息
                            if 'a'  in string or 'b' in string or 'c' in string or 'd' in string or 'e' in string or 'f' in string:
                                print("{}/{},{}在第{}页存在关键词,处理完毕".format(index_file+1,len(files),name,index+1))
                                count=1
                                state='T'
                                writer.writerow([name,count,index+1,state])
                                break
                            else:
                                print("{}/{},{}的第{}页正在处理".format(index_file+1,len(files),name,index+1))
            except:
                state='F'
                writer.writerow([name,state])

相关文章

  • PDF文件的读写

    一个简短的Python脚本,实现对PDF文档的读写

  • Python ☞ day 10

    Python学习笔记之 自动化办公与鼠标键盘模拟 读写csv文件 读csv文件 写csv文件 读取PDF文件 读...

  • Java实现Excel的导入导出

    一、Excel解析的几种实现方法(读写Excel三种常用技术) 二、生成PDF文件

  • 文件读写

    一 文件打开 文件访问模式 二 文件读写操作 三 文件关闭 四 结构化文本文件 1.csv 2.excel 3.pdf

  • 读写csv、pdf,doc文件

    导入csv模块以后 读csv文件 需要调用csv.reader(),读谁括号里传谁。 这里每一行都是一个list列...

  • Python读写PDF

    PDF的基本操作主要是读取、创建,合并等操作。使用Python的第三方包PyPDF2.读写合并PDF文件变得非常简...

  • Python | 如何读写文件?

    读写文件 2019年05月06日 18:30:18 《Python编程快速上手—让繁琐工作自动化》 PDF中文高清...

  • C语言读写文件

    C语言文件读写### 标准文件读写 非标准文件读写 标准文件读写 头文件 include 打开文件 函数原型:FI...

  • PDF编辑器如何使用,如何在PDF中添加书签

    PDF文件现在使用的频率很高,有时我们不止会使用到PDF文件,还需要编辑PDF文件,PDF文件的编辑是需要PDF编...

  • 如何编辑PDF文件,怎么修改PDF中的文字

    相信大家都使用过PDF文件,那么有没有编辑过PDF文件呢,PDF文件的编辑是需要借助PDF编辑器的,PDF文件中的...

网友评论

      本文标题:PDF文件的读写

      本文链接:https://www.haomeiwen.com/subject/jpauphtx.html