HTML转PDF转换
将远程HTML网页转换为本地PDF文件,完全控制渲染选项。支持两种模式:
转换模式选择
重要:首先判断用户需要哪种模式:
- 单页模式 - 用户只提到"转换这个网页"、"单个页面"
- 完整文档模式 - 用户提到"所有章节"、"完整文档"、"包含所有页面"、"侧边栏所有链接"
快速开始
单页转换流程
- 判断HTML源的复杂度(静态页面 vs JavaScript重度页面)
- 选择合适的库
- 如需要,处理身份验证/请求头
- 配置PDF输出选项
- 保存到本地文件
完整文档转换流程
- 访问文档首页
- 真实爬取侧边栏所有链接(不要猜测URL!)
- 等待JavaScript加载完成(至少10-15秒)
- 提取所有文档链接
- 逐个转换每个页面
- 合并成单个PDF文件
库选择指南
根据页面需求选择:
| 库 | 最适合 | 核心特性 |
|---|---|---|
| **Playwrigh |
[Description truncada. Veja o README completo no GitHub.]