大家好,我们继续网抓数据的学习,HTTP通讯一般情况返回的是啥呢?就是页面的源代码。今日我们开始学习HTML文档部分,这部分内容是我们认识服务器反馈会数据的基础,有了这部分的知识,我们才能更好从服务器返回的数据中提取我们需要的部分。在这部分的讲解中,我们需要了解HTML的各种元素,及其属性。这节内容是“VBA信息获取与处理”教程中第八个专题“VBA与HTML文档”的第一节。由于涉及到文章的审核相关问题(设计到一些网址的话审核通过十分困难),关于网抓的内容在平台上发表的不全,平台发表的代码有些运行不了,这是因为缺少某些自定义函数的过程,如果有需要学习网抓的朋友可以联络我分享这套教程。其中的程序文件是非常值得拥有的代码源码。第一节什么是HTML超文本标记语言我们上网需要浏览器,浏览器的作用就是把服务器返回的源代码,翻译成我们可视的生动地页面。它的作用是和VBA代码一样的,就要要把各种逻辑关系用代码的形式表现出来。服务器返回返回的源代码是什么语言呢,就是通常所说的,超文本标记语言。超文本标记语言(英语:HyperTextMarkupLanguage,简称:HTML)是一种用于创建网页的标准标记语言。您可以使用HTML来建立自己的WEB站点,HTML运行在浏览器上,由浏览器来解析。1超文本标记语言的作用什么是标记语言呢?顾名思义,它只能用于展示,展示我们所看到的网页页面。不是编程语言。为啥叫超文本呢,大家仔细看,这堆源代码有什么特征呢,就是有很多…这样的文本,一般而言,我们把…叫做标签。我们先看看下面一段的源码:!DOCTYPEhtmlPUBLIC-//W3C//DTDXHTML1.0Transitional//EN
转载请注明:http://www.aierlanlan.com/rzgz/8029.html