node.js网络爬虫之初识,技术诱惑。

Posted 代码学习搬运工

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了node.js网络爬虫之初识,技术诱惑。相关的知识,希望对你有一定的参考价值。

      “众里寻他千百度,蓦然回首,那人却在,灯火阑珊处。”

       笔者在工作中并没有运用到node.js相关技术,所以在笔者心中node.js还有着一层神秘面纱。轻撩面纱,从认识开始。一个简单的网络爬虫分享给大家。

1.什么是Node.js

      Node.js 是一个基于 Chrome V8 引擎的 javascript 运行环境。

       Node.js 使用了一个事件驱动、非阻塞式 I/O 的模型,使其轻量又高效。

       Node.js 的包管理器 npm,是全球最大的开源库生态系统。

其实Node.js 就是JavaScript执行环境和JavaScript扩展的功能。

      Node.js :一个可以运行JavaScript的平台,基于Chrome JavaScriptV8引擎,并且对JavaScript语言进行了增强,使JavaScript具有服务器语言开发的能力(操作文件,读取系统信息,网络等……)

      JavaScript:一门编程语言,只要有JavaScript引擎就能运行,各大浏览器都有自己的JavaScript引擎,并且如果JavaScript运行在浏览器中,浏览器对JavaScript加入了浏览器和文档操作的接口(方法)    

2.node.js的优势

   ①前后端语言统一(JavaScript 理想状态)

   ②前后端分离(淘宝架构)

   ③前端开发工具很多都基于Node.js,只有会Node.js,使用起来才能得心应手

   ④社区活跃,上千个成熟模块供我们选择使用

   ⑤上手快,开发简单

   ⑥Node.js薪资高,人才少

 3.Node.js安装与使用

          下载:

        英文:https://nodejs.org/en/ 

        中文:http://nodejs.cn/

node.js网络爬虫之初识,技术诱惑。


Windows系统下,选择和系统版本匹配的.msi后缀的安装文件。Mac OSX统下,

选择.pkg后缀的安装文件。默认安装即可

node.js网络爬虫之初识,技术诱惑。

REPL方式运行

NodeJs提供了REPL模式(cmd命令行)( Read-Evaluate-Print-Loop,输入-求值 -输出 -循环),即交互式命令行解析器),可以直接在命令行,编写NodeJs代码,适合检验和学习nodejs。

js文件方式【推荐】

       新建一个.js 文件,在命令行中运行。

4.Node.js的模块化

        Node.js采用模块方式管理和组织代码,Node.js所有的功能都存在每个模块中。一个具有特定功能的文件就是一个模块,模块之间可能存在一定的依赖关系,使用模块可以很好的把这些依赖关系整合起来。

5.Node.js网络爬虫

      下面是一个简单网络爬虫实现代码。当然看懂该代码需要一定的js基础的,如果你是小白建议你学习一下js基础。

      代码简单,功能完美这就是node.js的强大之处。

这是网站爬下来的图片:

        今天就分享到这里,简单易懂是笔者分享的初心,其实做网络爬虫Python也非常不错的技术,后期我也会分享一些Python相关技术。

       你希望掌握永恒,那你必须控制现在。






以上是关于node.js网络爬虫之初识,技术诱惑。的主要内容,如果未能解决你的问题,请参考以下文章

Python3 网络爬虫:初识网络爬虫之夜探老王家(2020年最新版)

python爬虫从入门到放弃之初识爬虫

爬虫之初识爬虫

python爬虫系列之初识爬虫

Node.js 使用爬虫批量下载网络图片到本地

直击!搜索引擎技术之网络爬虫