(给DotNet加星标,提升.Net技能)
转自:balahohocnblogs. 功能指数:★2、Wkhtmltox
这也是网上广泛流传的一个方案,wkhtmltox是一套开源的命令行工具,提供了图片和PDF的转换能力,它采用C++编写,使用Webkit作为渲染引擎
开源 功能指数:★★★★
3、PuppeteerSharp
这个就更厉害了,说到这个就不得不先介绍下Puppeteer,因为PuppeteerSharp正是从Puppeteer衍生而来。
Puppeteer是由谷歌开源的一个Node项目,它提供了和ChromeDevTools的通信能力,基本上我们能在Chrome实现的操作通过它的API都可以实现,强大到让你不敢相信。主要的应用有:
生成页面快照(图片、PDF)
爬虫,网站内容抓取
自动化测试(模拟键盘鼠标输入,表单提交,UI测试等)
网站性能分析(追踪,时间线捕获等)
开源地址是 功能指数:★★★★★
4、IronPdf
除了一些开源的项目和工具能提供HTML转图片或PDF的功能,很多商业软件公司也提供了这样的产品,IronPdf算是里面比较有代表性的一个。
和其他收费软件不同的是,IronPdf有一个对开发者免费试用的license:
IronPdf的主要特性包括:
任何类型的HTML文件、代码片段、URL生成PDF
PDF编辑
图片与PDF互转
支持HTML5和CSS3,支持响应式布局,支持JS脚本,丰富的配置选项
支持C#、VB、Webform、ASP.NETMVC、.NETCORE
我们可以在 功能指数:★★★★
写在最后
以上几种方式,都是我在本次实践中总结出来的,可能不是很全面,欢迎大家不吝补充。
遗憾的是,最终项目没有用上面的任何一种方式,而是抓取到HTML内容后用正则解析,然后用Bitmap一点一点重新画图生成图片文件保存。
因为我要截取的页面内容很少,就是一个简单的电子处方笺,需求上也没有要求必须完全和原网页%一致,绘图也算是一个不错的方案,但是缺点是一旦HTML结构或样式发生变化,那这套东西就失效了,好在这个不会轻易变更,也算是一个折中方案。
推荐阅读
(点击标题可跳转阅读)
C#爬虫与反爬虫字体加密
JetBrains发布年C#调查报告
查找.NETCore3.0占用CPU%的原因
看完本文有收获?请转发分享给更多人