ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Python PyPDF2 사용 페이지 분할
    프로그램밍 2023. 12. 7. 08:22

    PyPDF2 3.0 을 사용하여  폴더내 모든 PDF파일 첫페이지에서 특정 페이지까지 추출하여 다른 이름으로 저장한다. 

    저장하기전 워터마크도 추가 

     

    #!/usr/bin/python
    import os
    import PyPDF2

    # pdf 파일이 있는 폴더 지정
    pdfFold = "D:/Temp/"  
    # 워터마크가 있는 폴더 지정
    waterMarkFold = "D:/Temp"
    # 페이지 범위 설정 2 > 2페이지까지
    toPage = 2
    # 변환된 파일 헤드
    preHead = "표지"


    os.chdir(pdfFold)
    pdf_dir = os.getcwd()

    UUH = waterMarkFold+"/WaterMark.pdf"
    watermark_file = open(UUH,'rb')
    watermark_pdf  = PyPDF2.PdfReader(watermark_file)
    watermark_page = watermark_pdf.pages[0]

    for filename in os.listdir(pdf_dir):
        if filename.endswith('.pdf'):
            pdfWriter = PyPDF2.PdfWriter()
            #print(filename)
            pdf_file = open(os.path.join(pdf_dir, filename), 'rb')
            pdf_reader = PyPDF2.PdfReader(pdf_file)
           
            if len(pdf_reader.pages) <= 2:
                toPage = len(pdf_reader.pages)
            else:
                toPage = 2
                   
            for i in range(0,toPage):
                page = pdf_reader.pages[i]
                page.merge_page(watermark_page)
                pdfWriter.add_page(page)
           
            if len(pdfWriter.pages) > 0:
                outfileName = preHead+"_"+filename
                with open(outfileName, 'wb') as pdfOut:
                    pdfWriter.write(pdfOut)    
                    pdfOut.close()
                    print(outfileName)
            else:
                print("오류파일:"+filename)

    '프로그램밍' 카테고리의 다른 글

    PostgreSQL System SQL  (2) 2023.11.27
    Vertica table row count  (0) 2023.01.25
    OHDSI WebAPI 2.11.0 배포  (0) 2022.06.23
    R library 설치 오류  (0) 2020.10.29
    Postgresql dump restore 백업 복구  (0) 2020.07.03
Designed by Tistory.