微信小程序之复杂富文本解析变通实现

最近在写一个爬虫,需要将网页进行解析供微信小程序的使用。文字和图片解析都好说,小程序也有对应的text和image标签可以呈现。而更复杂的,比如表格,则比较棘手,不管是服务端解析还是小程序呈现都很费劲,也很难覆盖所有情况。于是我想,将表格对应的HTML代码转成图片,不失为一种变通的方法。

这里我们采用node-webshot模块,它对PhantomJS进行了轻量封装,可以轻松地将网页以截图形式保存下来。

首先安装Node和PhantomJS,然后新建一个js文件,加载node-webshot模块:

constwebshot=require('webshot');

定义选项:

ctions={//浏览器窗口

screenSize:{

width:755,

height:25

},

//要截图的页面文档区域

shotSize:{

height:'all'

},

//网页类型

siteType:'html'

};

这里,浏览器窗口的宽度要根据网页情况合理设置,高度可以设置为一个很小的数值,然后页面文档区域的高度一定要设置为all,宽度默认为窗口宽度,这样就可以把表格以最小的尺寸完整截图。

接下来,定义html字符串:

lethtml="targetrichtexthtmlcode,eg:<table>…</table>";…</table>";";

注意,里面的HTML代码一定要去掉换行符,并将双引号替换为单引号。

最后,截图:

webshot(html,'demo.png',options,(err)=>

{if(err)console.log(`Webshoterror:${err.message}`);});

{if(err)console.log(`Webshoterror:${err.message}`);});

这样,就实现了从HTML代码到本地图片的转换,后续可以上传。不管是服务端的解析,还是小程序的呈现,都没有什么难度了。【好店家整理,未经允许请勿转载】

原创文章,作者:蛋蛋,如若转载,请注明出处:https://www.dianja.com/ecschool/xcx/3036.html

发表评论

邮箱地址不会被公开。 必填项已用*标注

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息