apache tika1 apache tika 라이브러리를 이용하여 일반 문서 및 암호화된 문서의 정보 알아보기 Apache tika 라이브러리는 문서 파일에 대한 Mime Type을 탐지하고 파일의 내용과 여러 항목의 메타데이터를 추출할 수 있는 기능을 제공하는 라이브러리다. 단순히 파일의 확장자가 아닌 실제 파일의 내용을 기반으로 한 Mime Type을 알아야 해당 Mime Type에 맞는 적절한 파일 컨트롤을 할 수 있다. 이번 포스팅에서는 Tika 라이브러리를 사용하여 파일에 대한 Mime Type과 여러 가지 메타데이터를 추출하는 방법과 함께 MS Office, PDF 문서에 비밀번호가 설정된 경우에도 Mime Type을 확인해 볼 수 있는 방법을 소개하고자 한다. apache tika 라이브러리는 3.0.0-BETA 베타 버전과 함께 릴리즈된 2.9.1 버전까지 나와있다. 각 버전에 대한 릴리즈 노트는 .. 자바 2024. 3. 8. 이전 1 다음 💲 추천 글