蜜蜂采集器的采集数据,有几种方法导出到PDF文件。一种是数据编辑窗口的“导出当前页记录”,一种是“发布到文件”中添加文件发布模板。此外,也可以使用“发布到插件”的方式,通过插件发布到PDF文件。此前提到的,导出到Excel文件的功能,也可以使用“发布到插件”的方式实现。
导出当前页记录打开任意采集规则的“数据编辑”窗口,点击“菜单”——“全部”——“导出当前页记录”,即可导出为csv格式文件,即Excel表格文件。再使用Excel打开,另存为PDF文件。
这种方式只能导出当前页记录,可以通过修改每页的记录数,从而增加导出记录的数量。
发布到文件推荐使用“发布到文件”方式来实现导出到PDF文件的功能。
打开主菜单“发布”——“发布到文件”管理器。添加一个文件发布配置,其中的“输出文件名”为[任务名].[文件扩展名],模板文件路径自定义并且后缀为.html。标签转义设置为HTML转义。
发布到文件
系统自带模板中,仅支持输出[标签:标题]、[标签:内容]等几个固定标签。因此这里使用自定义模板方式。即,模板文件路径使用自定义路径,再点击“自动生成模板文件”,选中相应的采集规则,选中需要发布的标签,点击“确定”。至此,生成了文件发布模板。
自动生成模板文件
编辑采集任务规则时,内容发布通道中添加一个“发布到文件”通道,并选中刚刚添加的文件发布配置。至此,完成了文件发布的设置。
“发布到文件”通道
任务发布时,系统就会自动将数据发布到HTML文件中了。使用Word软件、网页浏览器等方式打开这个HTML文件,然后另存为PDF文件,即可。也可以发布为Excel格式,然后使用Excel打开,再另存为PDF文件。