摘要
1) 一句话总结 BentoPDF 是一款隐私优先、支持自托管的纯客户端 PDF 工具箱,通过浏览器本地处理文件,提供编辑、转换和自动化工作流等全方位功能,确保数据零上传与绝对安全。
2) 核心要点
- 纯前端架构:所有文件计算与处理均在本地浏览器中完成,无需服务器端参与,无文件大小或上传次数限制。
- 底层技术:集成 PyMuPDF、Ghostscript 和 CoherentPDF (CPDF) 等 WebAssembly (WASM) 模块,默认通过 CDN 动态加载,开箱即用。
- 丰富的编辑与管理功能:支持合并/拆分、批注、涂黑(Redact)、表单创建与填写(含 XFA)、添加水印/Bates 编号,以及基于 OpenCV 的自动纠偏等高级处理。
- 格式转换:支持将多种图像格式(如 HEIC、PSD、WebP 等)和 Office 文档(Word、Excel 等)转换为 PDF。
- 自动化工作流:内置 PDF Workflow Builder,提供可视化节点编辑器,用于构建自定义的 PDF 处理流水线。
- 灵活部署:支持在线使用、静态托管(Netlify、Vercel 等)、Docker/Podman 容器化部署,以及完全断网的内网环境部署。
- 双重授权模式:开源项目可免费使用(AGPL-3.0 协议);闭源商业应用提供 49 美元的终身买断制授权,无设备和用户数量限制,含终身更新。
3) 风险与不足
- 离线配置要求:在离线或物理隔离(Air-Gapped)环境中使用时,默认的 CDN 加载会失效,必须手动配置 WASM 以加载本地资源。
- 开源合规风险:免费版本受严格的 AGPL-3.0 协议约束,若用于闭源专有项目且未购买商业许可证,将面临违规风险。
- 特定功能依赖:部分特定功能(如数字签名)无法完全脱离外部环境,可能需要额外配置 CORS 代理。
功能与定位
BentoPDF 是一个强大、隐私优先且支持自托管的纯客户端 PDF 处理工具箱。它的核心定位是让用户直接在浏览器中完成 PDF 文件的操作、编辑、合并与处理,全程无需服务器端参与,从而确保文件的绝对安全与隐私。
典型使用场景
- 高隐私需求处理:处理包含敏感信息的 PDF 文件,避免将文件上传至第三方云端服务器。
- 无限制办公处理:需要频繁处理大量或大体积 PDF 文件,且不希望受到传统在线工具的上传次数或文件大小限制。
- 内网/离线部署:企业或个人需要在物理隔离(Air-Gapped)或无外网连接的环境中部署内部 PDF 工具。
- 自动化流水线:需要通过可视化节点构建自定义的 PDF 处理工作流。
核心功能
- 组织与管理:
- 合并、拆分、提取、删除、旋转、重排页面。
- 支持多页拼版(N-Up)、制作双面打印小册子(Booklet)、海报化分割。
- 添加、提取或编辑 PDF 内嵌附件;将多个 PDF 打包为 ZIP。
- 比较 PDF 文件、查看隐藏元数据。
- 编辑与修改:
- 全功能编辑器:支持批注、高亮、涂黑(Redact)、评论、添加形状/图片及文本搜索。
- 表单处理:创建符合标准的交互式可填表单(文本框、复选框、下拉菜单、签名等),并支持填写表单(含 XFA 表单)。
- 页面修饰:添加页码、Bates 编号、水印、自定义页眉/页脚。
- 高级处理:自动纠偏(基于 OpenCV)、裁剪、字体转曲(Font to Outline)、展平 PDF(将表单和批注转为静态内容)、移除空白页或批注。
- 颜色与视觉调整:反转颜色、修改背景/文本颜色、调整亮度/对比度/饱和度,以及模拟“扫描仪效果”。
- 导航管理:添加、编辑、导入/导出书签,并可根据书签自动生成目录页。
- 格式转换:
- 支持将多种图像格式(JPG, PNG, WebP, SVG, BMP, HEIC, TIFF, PSD 等)转换为 PDF。
- 支持将 Office 文档(Word, Excel, PowerPoint, ODT 等)转换为 PDF。
- 自动化:
- PDF Workflow Builder:提供可视化节点编辑器,用于构建自定义的 PDF 处理流水线。
特色与差异点
- 纯前端架构:所有计算均在本地浏览器中完成,速度快且无上传限制。
- 零配置开箱即用:底层集成了 PyMuPDF、Ghostscript 和 CoherentPDF (CPDF) 等强大的 WebAssembly (WASM) 模块,默认通过 jsDelivr CDN 动态加载,无需手动配置。
- 双重授权模式:
- AGPL-3.0:对公开源码的开源项目免费。
- 商业授权:提供 49 美元的终身买断制授权,适用于闭源商业应用,无设备和用户数量限制,且包含终身更新。
- 高度可定制:支持自定义品牌标识(Custom Branding)和简单模式(Simple Mode)以适应内部使用需求。
使用方式概览
- 在线使用:直接通过浏览器访问使用各项功能。
- 静态托管:可轻松部署在 Netlify、Vercel、GitHub Pages 等静态托管平台上。
- 容器化部署:官方提供 Docker 镜像,支持通过 Docker Compose 或 Podman Compose 进行部署,并支持 Podman Quadlet systemd 集成。
- 离线/内网部署:支持配置本地 WASM 资源,实现完全断网环境下的独立运行。
限制与注意事项
- 默认情况下,BentoPDF 依赖 CDN 加载 WASM 模块。如果在离线或内网(Air-Gapped)环境中使用,必须手动进行 WASM 配置以加载本地资源。
- 免费版本受 AGPL-3.0 协议约束,若用于闭源专有项目需购买商业许可证以豁免开源义务。
- 某些特定功能(如数字签名)可能需要配置 CORS 代理。
链接
- GitHub 仓库: https://github.com/alam00000/bentopdf
- 官方网站: https://bentopdf.com/
- 官方文档: https://bentopdf.com/docs/
- 商业授权说明: https://bentopdf.com/licensing.html