Paperless-ngx是一個開源的文檔管理系統,提供多樣化格式支持、靈活分類、本地安全存儲、OCR技術應用、智能功能和用戶交互界面等功能。
大家好,今天給大家分享一個開源的文檔管理系統Paperless-ngx,旨在將物理文檔轉換為可搜索的在線檔案,以實現無紙化辦公和高效的文檔管理。
項目介紹
Paperless-ngx是一個開源的文檔管理系統,旨在幫助用戶實現無紙化辦公。它允許用戶掃描、上傳和存儲文檔,并且通過強大的索引和搜索功能,方便用戶快速查找和訪問所需的文檔。
該項目建立在之前 Paperless 項目的基礎上,進行了諸多改進和功能擴展。
核心特點
1.文檔管理與組織
? 多樣化格式支持:能處理 PDF、圖像文件(如 JPEG、PNG)、純文本文件、Office 文檔(Word、Excel、PowerPoint 及 LibreOffice 等效格式)等多種格式的文檔。
? 靈活的分類方式:通過標簽、通信人、類型等對掃描文檔進行組織和索引,用戶可自由配置文件名和文件夾格式,還支持自定義字段與多種數據類型。
2.數據處理與存儲
? 本地安全存儲:數據存儲在本地服務器,絕不傳輸或共享,保障數據安全。
? OCR 技術應用:運用開源 Tesseract 引擎進行 OCR 操作,識別超 100 種語言,為文檔添加可搜索和選擇的文本,便于掃描圖像文檔的搜索。
? PDF/A 格式保存:文檔以適合長期存儲的 PDF/A 格式保存,并保留原始文檔不變。
3.智能功能特性
? 機器學習輔助:利用機器學習自動為文檔添加標簽、通信人和文檔類型。
? 高效索引與搜索:構建高效索引,支持全文搜索,具備自動補全、按相關性排序、高亮顯示匹配部分、搜索相似文檔等功能。
4.用戶交互與界面
? 美觀易用的 Web 應用:擁有現代、美觀且可定制的 Web 界面,包含可定制儀表盤、多方式篩選、批量編輯、拖放上傳、可保存和顯示自定義視圖、支持共享公共鏈接(可選過期)等功能。
? 適配多種模式:提供三種文檔列表瀏覽風格,支持 “精簡” 側邊欄專注文檔操作,還具備黑暗模式。
5.權限管理與協作
? 強大的權限系統:內置穩健的多用戶權限系統,支持全局權限以及按文檔或對象的權限設置。
? 協作與工作流:支持電子郵件處理,可從多個郵箱賬戶導入文檔并配置規則,同時擁有強大的工作流系統,優化多核系統,可并行處理多個文檔。
6.系統維護與支持
? 集成健康檢查:集成健全性檢查器,確保文檔檔案狀態良好。
? 社區支持與協作:通過 GitHub 討論和 Matrix 聊天室提供社區支持,用戶可提交功能請求、報告 Bug、參與貢獻(包括翻譯),還與多種掃描儀和掃描工具兼容,其 Office 文檔和電子郵件處理功能由 Apache Tika 提供(可選,需配置)。
應用場景
個人用戶:整理家庭賬單、合同、證書等重要文件,告別雜亂無章的硬盤。
小型企業:統一管理發票、合同、員工檔案等,提高工作效率。
學術研究:存儲論文草稿、參考文獻、實驗數據等,便于檢索和分享。
協作團隊:共享和協作項目文檔,通過權限管理保障數據安全。
安裝使用
安裝
1.使用安裝腳本(Docker方式)
確保已安裝 Docker 和 Docker Compose??蓞⒖糷ttps://docs.docker.com/engine/install/獲取 Docker 安裝說明。
下載并運行安裝腳本,命令為
$ bash -c "$(curl --location --silent --show-error https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/install-paperless-ngx.sh)"
此腳本會自動完成配置文件下載、創建,拉取 Docker 鏡像,啟動 Paperless 并創建用戶賬戶等一系列操作。
需注意,macOS 用戶可能需要安裝支持以sed運行的 gnu-sed。
2.從 GHCR / Docker Hub 安裝
創建項目運行目錄:
mkdir -v ~/paperless-ngx
在github項目compose目錄[1]下載使用對應數據庫的docker-compose.*.yml文件,重命名為docker-compose.yml。
如果要啟用對Office文檔的可選支持,請下載文件名中包含-tika的文件。下載docker-comp. env文件和.env文件并將它們存儲在同一目錄中。
編輯docker-compose.yml文件,修改目錄掛載路徑
- ./consume:/usr/src/paperless/consume
將冒號前部分替換為所選本地目錄
調整Web服務器端口
ports:
- 8000:8000
將冒號前部分替換為所選端口。
注意,冒號后部分不要修改,否則 Paperless 無法找到文檔。
運行docker compose pull拉取鏡像。
通過docker compose run --rm webserver createsuperuser或在容器內使用python3 manage.py createsuperuser創建超級用戶,設置用戶名、可選郵箱和至少 8 位密碼。
最后運行docker compose up -d創建并啟動必要容器,若未修改默認端口,可通過http://127.0.0.1:8000或服務器 IP 地址:8000 訪問,使用創建的登錄憑據登錄。
3.自行構建 Docker 鏡像
克隆倉庫:
git clone https://github.com/paperless-ngx/paperless-ngx
主分支始終反映最新穩定版本。
將docker/compose/docker-compose.*.yml中的一個文件復制到項目根目錄并命名為docker-compose.yml,同時復制docker-compose.env到項目根目錄,根據使用的數據庫后端選擇合適的文件。
在docker-compose.yml中找到webserver部分的image: ghcr.io/paperless-ngx/paperless-ngx:latest,替換為build: context:.,指示從當前工作目錄構建鏡像。
按照 “從 GHCR / Docker Hub 安裝” 中的步驟進行操作,在需要運行docker compose pull拉取鏡像時,改為運行docker compose build構建鏡像。
使用
詳細功能使用方法,請閱讀官方教程[2]。
項目地址
https://github.com/paperless-ngx/paperless-ngx
引用鏈接
[1] compose目錄: https://github.com/paperless-ngx/paperless-ngx/tree/main/docker/compose
[2] 官方教程: https://docs.paperless-ngx.com/usage/
原諒來源:https://mp.weixin.qq.com/s/9Nm6c1sYKGEftU4520E03w
來源:本文內容搜集或轉自各大網絡平臺,并已注明來源、出處,如果轉載侵犯您的版權或非授權發布,請聯系小編,我們會及時審核處理。
聲明:江蘇教育黃頁對文中觀點保持中立,對所包含內容的準確性、可靠性或者完整性不提供任何明示或暗示的保證,不對文章觀點負責,僅作分享之用,文章版權及插圖屬于原作者。
Copyright?2013-2024 JSedu114 All Rights Reserved. 江蘇教育信息綜合發布查詢平臺保留所有權利
蘇公網安備32010402000125
蘇ICP備14051488號-3技術支持:南京博盛藍睿網絡科技有限公司
南京思必達教育科技有限公司版權所有 百度統計