logo

Python ThreadPoolExecutor를 활용한 PDF 요약

* 관련 기술 스택이 없습니다
emoji

• 사내 프롬프톤에서 1위를 한 덕분에 각종 LLM관련 프로젝트들이 할당되었고, 현재 진행 중인 프로젝트는 석유화학 산업에서 특정 제품의 시장 트렌드와 제품의 가격 변동을 예측하는 것이다.
• 프로젝트를 위해 다양한 곳으로부터 받은 유료 자료들을 활용하려 했으나, 이 자료들을 하나로 합친 후 요약하는 데에 시간이 너무 오래 걸렸다.
• 따라서, 프로그래밍을 통해 기능을 구현하기로 결정하였고, MultiThread를 활용하여 여러 개의 문서를 병렬적으로 요약하고, 텍스트로 요약된 결과들을 활용하여 최종 결론을 내는 방식을 선택하였다.
• 이 방식을 통해 기존에 한 시간이 넘게 소요되었던 작업이 1분여만에 끝나게 되었고, 번역은 DeepL API를 활용하여 진행하였다.

thumbnail
북마크
공유하기
신고하기
7분 분량
조회수 104
profile-image뱅진
일 년 전
Copyright © 2025. Codenary All Rights Reserved.