html2file-html转文档服务
github
说明
自己用java写文档转化生成果然有很多弊端和不兼容的地方,而一些开源插件转这些东西还是效果蛮不错,于是心生收集各种插件(兼容windows和linux)并封装成服务的想法
这里我将收集一系列html转文档的开源插件,做成html页面转文件的微服务集成Web应用,预计包含:
- 网页转PDF
- 网页转图片
- 网页转TEXT
- 网页转WORD
- 网页转markdown
- 网页转excel
- 网页转…
目前支
1.网页转PDF(wkhtml2pdf插件
1 | 例如:http://localhost:7800/html2pdf?pageUrl=https://wkhtmltopdf.org |
2.网页转图片(wkhtml2pdf插件)
1 | 例如:http://localhost:7800/html2image?pageUrl=https://wkhtmltopdf.org&fileExt=[可为空|默认 .png |
3.网页转Markdown(参用jHTML2Md)
1 | 例如:http://localhost:7800/html2markdown?pageUrl=http://jsoup.or |
4.网页转WORD(参用Apache POI)
1 | 例如:http://localhost:7800/html2word?pageUrl=http://poi.apache.org |
5.网页转Excel(参用table-to-xls)
1 | 例如:http://localhost:7800/html2excel?pageUrl=http://www.jjwxc.net/bookbase_slave.php?booktype=free |
API 服务
服务入口:
/html2file
请求方式:
post
服务入参:
1
2
3
4
5
6{
"pageUrl":"https://wkhtmltopdf.org",
"fileType":"2",
"fileExt":""
"pageHtmlContent":""
}pageUrl
:目标链接,带http的链接,无登陆权限验证fileType
:文件类型,1-img,2-pdf,3-markdown,4-word,5-excelfileExt
:文件扩展名,图片转化可以转化为不同后缀格式的图片pageHtmlContent
:目标页面Html内容,当不能提供pageUrl时,将html内容传入也可以转化,其中引用的css和js需要为带http的路径,不能为相对路径
服务出参:
1
2
3
4
5{
"status":1,
"result":"/output/20180417/pdf/9c3fd3018bb041429bba702cd127be9e.pdf",
"errorMsg":""
}status
:状态,1-成功,-1-失败result
:结果,这里为转化后的文件路径errorMsg
:错误信息
服务部署
服务开箱即用,Maven已经配好发布过程,install后将 dist
内的文件夹复制到服务器,将进入到 bin/
文件夹下面
- linux系统
1 | chmod +x html2file.sh #授权脚本 |
中文乱码或空白的话,将 resources/font/simsun.ttc
拷贝到linux服务器 /usr/share/fonts/
目录下
- windows系统
直接双击 html2file.bat
文件即可,也可以将该文件注册成服务,在服务管理里面启动。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 王文哲的博客!