Python处理PDF神器PyMuPDF库

编程 · 2023-08-13 · 178 人浏览

安装

pip install PyMuPDF -i https://pypi.douban.com/simple/

使用

import fitz  # 导入 PyMuPDF 库
filename = '100.pdf'
## 打开文档
doc = fitz.open(filename)

Document属性和方法

属性/方法描述
Document.page_count页数(int)
Document.metadata元数据(dict)
Document.get_toc()获取目录(list)
Document.load_page()读取页面

页面

page = doc.load_page(1)
links = page.get_links()  # 获取所有链接,返回字典列表
annots = page.annots()  # 获取注释
widgets = page.widgets()  # 获取表单字段
text = page.get_text('html')  # 获取页面信息
images = page.get_images()  # 获取图像列表值。列表中,元组第一位是 xref 值
Python
Theme Jasmine by Kent Liao