-
Python PyPDF2 사용 페이지 분할프로그램밍 2023. 12. 7. 08:22
PyPDF2 3.0 을 사용하여 폴더내 모든 PDF파일 첫페이지에서 특정 페이지까지 추출하여 다른 이름으로 저장한다.
저장하기전 워터마크도 추가
#!/usr/bin/pythonimport osimport PyPDF2
# pdf 파일이 있는 폴더 지정pdfFold = "D:/Temp/"# 워터마크가 있는 폴더 지정waterMarkFold = "D:/Temp"# 페이지 범위 설정 2 > 2페이지까지toPage = 2# 변환된 파일 헤드preHead = "표지"
os.chdir(pdfFold)pdf_dir = os.getcwd()
UUH = waterMarkFold+"/WaterMark.pdf"watermark_file = open(UUH,'rb')watermark_pdf = PyPDF2.PdfReader(watermark_file)watermark_page = watermark_pdf.pages[0]
for filename in os.listdir(pdf_dir):if filename.endswith('.pdf'):pdfWriter = PyPDF2.PdfWriter()#print(filename)pdf_file = open(os.path.join(pdf_dir, filename), 'rb')pdf_reader = PyPDF2.PdfReader(pdf_file)if len(pdf_reader.pages) <= 2:toPage = len(pdf_reader.pages)else:toPage = 2for i in range(0,toPage):page = pdf_reader.pages[i]page.merge_page(watermark_page)pdfWriter.add_page(page)if len(pdfWriter.pages) > 0:outfileName = preHead+"_"+filenamewith open(outfileName, 'wb') as pdfOut:pdfWriter.write(pdfOut)pdfOut.close()print(outfileName)else:print("오류파일:"+filename)'프로그램밍' 카테고리의 다른 글
PostgreSQL System SQL (2) 2023.11.27 Vertica table row count (0) 2023.01.25 OHDSI WebAPI 2.11.0 배포 (0) 2022.06.23 R library 설치 오류 (0) 2020.10.29 Postgresql dump restore 백업 복구 (0) 2020.07.03