證件照線上製作 HivisionIDPhotos
HivisionIDPhotos 證件照在線製作!支持離線、換裝、美顏等
HivisionIDPhotos 是一款功能強大的開源證件照生成工具。用戶只需上傳一張人像照片,它就能智能裁剪為一寸、兩寸等標準尺寸,同時自動去除背景並渲染新的背景顏色,例如藍色、白色、紅色,還支持漸變色和自定義顏色。生成的證件照會自動排版為標準的六寸規格,方便用戶打印和批量製作。

未來,HivisionIDPhotos 計劃推出更多實用功能,例如美顏優化、一鍵更換正裝等,讓證件照製作變得更加高效和便捷。目前,該工具已在 Huggingface 等平台上免費開放,懂編程的用戶還可以將其部署到本地,享受更個性化的使用體驗。
在線免費使用:【連結直達】
HivisionIDPhoto 可以做到:
- 輕量級抠圖(純離線,僅需 CPU 即可快速推理)
- 根據不同尺寸規格生成不同的標準證件照、六寸排版照
- 支持 純離線 或 端雲 推理
- 美顏
- 智能換正裝(waiting)


2、本地安裝部署
環境安裝與依賴:
- Python >= 3.7(項目主要測試在 python 3.10)
- 作業系統:Linux、Windows、MacOS
1. 克隆項目
2. 安裝依賴環境
建議在 conda 中創建一個 python3.10 虛擬環境後,執行以下命令
3. 下載人像抠圖模型權重文件
方式二:直接下載
模型均存到項目的hivision/creator/weights目錄下:
| 人像抠圖模型 | 介紹 | 下載 |
|---|---|---|
| MODNet | MODNet官方權重 | 下載(24.7MB) |
| hivision_modnet | 對純色換底適配性更好的抠圖模型 | 下載(24.7MB) |
| rmbg-1.4 | BRIA AI 開源的抠圖模型 | 下載(176.2MB)後重命名为rmbg-1.4.onnx |
| birefnet-v1-lite | ZhengPeng7 開源的抠圖模型,擁有最好的分割精度 | 下載(224MB)後重命名为birefnet-v1-lite.onnx |
如果下載網速不順利:前往SwanHub下載。
4. 人臉檢測模型配置(可選)
| 拓展人臉檢測模型 | 介紹 | 使用文件 |
|---|---|---|
| MTCNN | 離線人臉檢測模型,高性能 CPU 推理(毫秒級),為預設模型,檢測精度較低 | 克隆此項目後直接使用 |
| RetinaFace | 離線人臉檢測模型,CPU 推理速度中等(秒級),精度較高 | 下載後放到 hivision/creator/retinaface/weights 目錄下 |
| Face++ | 旷視推出的在線人臉檢測 API,檢測精度較高,官方文件 | 使用文件 |
5. 性能參考
測試環境為 Mac M1 Max 64GB,非 GPU 加速,測試圖片分辨率為 512×715(1) 與 764×1146(2)。
| 模型組合 | 記憶體佔用 | 推理時長(1) | 推理時長(2) |
|---|---|---|---|
| MODNet + mtcnn | 410MB | 0.207 秒 | 0.246 秒 |
| MODNet + retinaface | 405MB | 0.571 秒 | 0.971 秒 |
| birefnet-v1-lite + retinaface | 6.20GB | 7.063 秒 | 7.128 秒 |
6. GPU 推理加速(可選)
在當前版本,可被英偉達 GPU 加速的模型為birefnet-v1-lite,並請確保你有 16GB 左右的顯存。
如需使用英偉達 GPU 加速推理,請確保你已經安裝CUDA與cuDNN後,根據onnxruntime-gpu 文檔找到對應的onnxruntime-gpu版本安裝,以及根據pytorch 官網找到對應的torch版本安裝。
完成安裝後,調用birefnet-v1-lite模型即可利用 GPU 加速推理。
TIPS: CUDA 支援向下相容。例如你的 CUDA 版本為 12.6,
torch官方目前支援的最高版本為 12.4(<12.6),torch仍可以正常使用 CUDA。
⚡️ 運行 Gradio Demo
運行程序將生成一個本地 Web 頁面,在頁面中可完成證件照的操作與互動。
![图片[4]-HivisionIDPhotos 证件照在线制作!支持离线、换装、美颜等-零度博客](https://www.freedidi.com/wp-content/uploads/2024/12/164713-.png)
🚀 Python 推理
核心參數:
-i: 輸入圖像路徑-o:保存圖像路徑-t: 推理類型,有 idphoto、human_matting、add_background、generate_layout_photos 可選--matting_model: 人像抠圖模型權重選擇--face_detect_model: 人臉檢測模型選擇
更多參數可通過python inference.py --help查看
證件照製作
輸入 1 張照片,獲得 1 張標準證件照和 1 張高清證件照的 4 通道透明 png
2. 人像抠圖
輸入 1 張照片,獲得 1 張 4 通道透明 png
3. 透明圖增加底色
輸入 1 張 4 通道透明 png,獲得 1 張增加了底色的 3 通道圖像
4. 得到六寸排版照
5. 證件照裁剪
Docker 一鍵部署
2. 運行服務
啟動 Gradio Demo 服務
運行下面的命令,在你的本地訪問 http://127.0.0.1:7860 即可使用。
docker run -d -p 7860:7860 linzeyi/hivision_idphotos啟動 API 後端服務
docker run -d -p 8080:8080 linzeyi/hivision_idphotos python3 deploy_api.py兩個服務同時啟動
docker compose up -d環境變數
本項目提供了一些額外的配置項,使用環境變量進行設置:
| 環境變數 | 類型 | 描述 | 示例 |
|---|---|---|---|
| FACE_PLUS_API_KEY | 可選 | 這是你在 Face++ 控制台申請的 API 密鑰 | 7-fZStDJ···· |
| FACE_PLUS_API_SECRET | 可選 | Face++ API 密钥对应的 Secret | VTee824E···· |
| RUN_MODE | 可選 | 運行模式,可選值為beast(野獸模式)。野獸模式下人臉檢測和抠圖模型將不釋放內存,從而獲得更快的二次推理速度。建議內存 16GB 以上嘗試。 | 野獸 |
| DEFAULT_LANG | 可選 | Gradio Demo 啟動時的預設語言 | en |
docker 使用環境變數示例:
docker run -d -p 7860:7860 \
-e FACE_PLUS_API_KEY=7-fZStDJ···· \
-e FACE_PLUS_API_SECRET=VTee824E···· \
-e RUN_MODE=beast \
-e DEFAULT_LANG=en \
linzeyi/hivision_idphotos
留言
張貼留言