pythonでPDFを分割・結合する方法

複数のPDFを結合する

1.pdfと2.pdfを結合して3.pdfを作成する。

import PyPDF2
merger = PyPDF2.PdfFileMerger()
merger.append('1.pdf')
merger.append('2.pdf')
merger.write('3.pdf')
merger.close()

PDFを1ページずつ分割する

3.pdfを1.pdfと2.pdfに分割する。
ページ数がたくさんあってもページ毎に分割できる。

import PyPDF2

def split_pdf_pages(src_path, dst_basepath):
    src_pdf = PyPDF2.PdfFileReader(src_path)
    for i in range(src_pdf.numPages):
        dst_pdf = PyPDF2.PdfFileWriter()
        dst_pdf.addPage(src_pdf.getPage(i))
        with open('{}_{}.pdf'.format(dst_basepath, i), 'wb') as f:
            dst_pdf.write(f)

split_pdf_pages('3.pdf', 'sample')

.numPages:ページ数
.getPage(i):特定のページを取得

extractTextメソッド
PageオブジェクトからPDFのテキストを抽出する。

text = page.extractText()


コメント

タイトルとURLをコピーしました