共计 440 个字符,预计需要花费 2 分钟才能阅读完成。
安装
pip install PyMuPDF -i https://pypi.douban.com/simple/
使用
import fitz # 导入 PyMuPDF 库
filename = '100.pdf'
## 打开文档
doc = fitz.open(filename)
Document 属性和方法
属性 / 方法 | 描述 |
---|---|
Document.page_count | 页数(int) |
Document.metadata | 元数据(dict) |
Document.get_toc() | 获取目录(list) |
Document.load_page() | 读取页面 |
页面
page = doc.load_page(1)
links = page.get_links() # 获取所有链接,返回字典列表
annots = page.annots() # 获取注释
widgets = page.widgets() # 获取表单字段
text = page.get_text('html') # 获取页面信息
images = page.get_images() # 获取图像列表值。列表中,元组第一位是 xref 值
正文完