摘要

1) 一句话总结 BentoPDF 是一款隐私优先、支持自托管的纯客户端 PDF 工具箱,通过浏览器本地处理文件,提供编辑、转换和自动化工作流等全方位功能,确保数据零上传与绝对安全。

2) 核心要点

  • 纯前端架构:所有文件计算与处理均在本地浏览器中完成,无需服务器端参与,无文件大小或上传次数限制。
  • 底层技术:集成 PyMuPDF、Ghostscript 和 CoherentPDF (CPDF) 等 WebAssembly (WASM) 模块,默认通过 CDN 动态加载,开箱即用。
  • 丰富的编辑与管理功能:支持合并/拆分、批注、涂黑(Redact)、表单创建与填写(含 XFA)、添加水印/Bates 编号,以及基于 OpenCV 的自动纠偏等高级处理。
  • 格式转换:支持将多种图像格式(如 HEIC、PSD、WebP 等)和 Office 文档(Word、Excel 等)转换为 PDF。
  • 自动化工作流:内置 PDF Workflow Builder,提供可视化节点编辑器,用于构建自定义的 PDF 处理流水线。
  • 灵活部署:支持在线使用、静态托管(Netlify、Vercel 等)、Docker/Podman 容器化部署,以及完全断网的内网环境部署。
  • 双重授权模式:开源项目可免费使用(AGPL-3.0 协议);闭源商业应用提供 49 美元的终身买断制授权,无设备和用户数量限制,含终身更新。

3) 风险与不足

  • 离线配置要求:在离线或物理隔离(Air-Gapped)环境中使用时,默认的 CDN 加载会失效,必须手动配置 WASM 以加载本地资源。
  • 开源合规风险:免费版本受严格的 AGPL-3.0 协议约束,若用于闭源专有项目且未购买商业许可证,将面临违规风险。
  • 特定功能依赖:部分特定功能(如数字签名)无法完全脱离外部环境,可能需要额外配置 CORS 代理。

功能与定位

BentoPDF 是一个强大、隐私优先且支持自托管的纯客户端 PDF 处理工具箱。它的核心定位是让用户直接在浏览器中完成 PDF 文件的操作、编辑、合并与处理,全程无需服务器端参与,从而确保文件的绝对安全与隐私。

典型使用场景

  • 高隐私需求处理:处理包含敏感信息的 PDF 文件,避免将文件上传至第三方云端服务器。
  • 无限制办公处理:需要频繁处理大量或大体积 PDF 文件,且不希望受到传统在线工具的上传次数或文件大小限制。
  • 内网/离线部署:企业或个人需要在物理隔离(Air-Gapped)或无外网连接的环境中部署内部 PDF 工具。
  • 自动化流水线:需要通过可视化节点构建自定义的 PDF 处理工作流。

核心功能

  • 组织与管理
    • 合并、拆分、提取、删除、旋转、重排页面。
    • 支持多页拼版(N-Up)、制作双面打印小册子(Booklet)、海报化分割。
    • 添加、提取或编辑 PDF 内嵌附件;将多个 PDF 打包为 ZIP。
    • 比较 PDF 文件、查看隐藏元数据。
  • 编辑与修改
    • 全功能编辑器:支持批注、高亮、涂黑(Redact)、评论、添加形状/图片及文本搜索。
    • 表单处理:创建符合标准的交互式可填表单(文本框、复选框、下拉菜单、签名等),并支持填写表单(含 XFA 表单)。
    • 页面修饰:添加页码、Bates 编号、水印、自定义页眉/页脚。
    • 高级处理:自动纠偏(基于 OpenCV)、裁剪、字体转曲(Font to Outline)、展平 PDF(将表单和批注转为静态内容)、移除空白页或批注。
    • 颜色与视觉调整:反转颜色、修改背景/文本颜色、调整亮度/对比度/饱和度,以及模拟“扫描仪效果”。
    • 导航管理:添加、编辑、导入/导出书签,并可根据书签自动生成目录页。
  • 格式转换
    • 支持将多种图像格式(JPG, PNG, WebP, SVG, BMP, HEIC, TIFF, PSD 等)转换为 PDF。
    • 支持将 Office 文档(Word, Excel, PowerPoint, ODT 等)转换为 PDF。
  • 自动化
    • PDF Workflow Builder:提供可视化节点编辑器,用于构建自定义的 PDF 处理流水线。

特色与差异点

  • 纯前端架构:所有计算均在本地浏览器中完成,速度快且无上传限制。
  • 零配置开箱即用:底层集成了 PyMuPDF、Ghostscript 和 CoherentPDF (CPDF) 等强大的 WebAssembly (WASM) 模块,默认通过 jsDelivr CDN 动态加载,无需手动配置。
  • 双重授权模式
    • AGPL-3.0:对公开源码的开源项目免费。
    • 商业授权:提供 49 美元的终身买断制授权,适用于闭源商业应用,无设备和用户数量限制,且包含终身更新。
  • 高度可定制:支持自定义品牌标识(Custom Branding)和简单模式(Simple Mode)以适应内部使用需求。

使用方式概览

  • 在线使用:直接通过浏览器访问使用各项功能。
  • 静态托管:可轻松部署在 Netlify、Vercel、GitHub Pages 等静态托管平台上。
  • 容器化部署:官方提供 Docker 镜像,支持通过 Docker Compose 或 Podman Compose 进行部署,并支持 Podman Quadlet systemd 集成。
  • 离线/内网部署:支持配置本地 WASM 资源,实现完全断网环境下的独立运行。

限制与注意事项

  • 默认情况下,BentoPDF 依赖 CDN 加载 WASM 模块。如果在离线或内网(Air-Gapped)环境中使用,必须手动进行 WASM 配置以加载本地资源。
  • 免费版本受 AGPL-3.0 协议约束,若用于闭源专有项目需购买商业许可证以豁免开源义务。
  • 某些特定功能(如数字签名)可能需要配置 CORS 代理。

链接

关联主题