複数のPDFを結合する
1.pdfと2.pdfを結合して3.pdfを作成する。
import PyPDF2
merger = PyPDF2.PdfFileMerger()
merger.append('1.pdf')
merger.append('2.pdf')
merger.write('3.pdf')
merger.close()
PDFを1ページずつ分割する
3.pdfを1.pdfと2.pdfに分割する。
ページ数がたくさんあってもページ毎に分割できる。
import PyPDF2
def split_pdf_pages(src_path, dst_basepath):
src_pdf = PyPDF2.PdfFileReader(src_path)
for i in range(src_pdf.numPages):
dst_pdf = PyPDF2.PdfFileWriter()
dst_pdf.addPage(src_pdf.getPage(i))
with open('{}_{}.pdf'.format(dst_basepath, i), 'wb') as f:
dst_pdf.write(f)
split_pdf_pages('3.pdf', 'sample')
.numPages:ページ数
.getPage(i):特定のページを取得
extractTextメソッド
PageオブジェクトからPDFのテキストを抽出する。
text = page.extractText()
コメント