Python ThreadPoolExecutor를 활용한 PDF 요약
* 관련 기술 스택이 없습니다

• 사내 프롬프톤에서 1위를 한 덕분에 각종 LLM관련 프로젝트들이 할당되었고, 현재 진행 중인 프로젝트는 석유화학 산업에서 특정 제품의 시장 트렌드와 제품의 가격 변동을 예측하는 것이다.
• 프로젝트를 위해 다양한 곳으로부터 받은 유료 자료들을 활용하려 했으나, 이 자료들을 하나로 합친 후 요약하는 데에 시간이 너무 오래 걸렸다.
• 따라서, 프로그래밍을 통해 기능을 구현하기로 결정하였고, MultiThread를 활용하여 여러 개의 문서를 병렬적으로 요약하고, 텍스트로 요약된 결과들을 활용하여 최종 결론을 내는 방식을 선택하였다.
• 이 방식을 통해 기존에 한 시간이 넘게 소요되었던 작업이 1분여만에 끝나게 되었고, 번역은 DeepL API를 활용하여 진행하였다.

북마크
공유하기
신고하기