pip install PyMuPDF -i https://pypi.douban.com/simple/
import fitz # 导入 PyMuPDF 库 filename = '100.pdf' ## 打开文档 doc = fitz.open(filename)
属性/方法描述Document.page_count页数(int)Document.metadata元数据(dict)Document.get_toc()获取目录(list)Document.load_page()读取页面
page = doc.load_page(1) links = page.get_links() # 获取所有链接,返回字典列表 annots = page.annots() # 获取注释 widgets = page.widgets() # 获取表单字段 text = page.get_text('html') # 获取页面信息 images = page.get_images() # 获取图像列表值。列表中,元组第一位是 xref 值
本文作者:a
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!