node.js网络爬虫之初识,技术诱惑。
Posted 代码学习搬运工
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了node.js网络爬虫之初识,技术诱惑。相关的知识,希望对你有一定的参考价值。
“众里寻他千百度,蓦然回首,那人却在,灯火阑珊处。”
笔者在工作中并没有运用到node.js相关技术,所以在笔者心中node.js还有着一层神秘面纱。轻撩面纱,从认识开始。一个简单的网络爬虫分享给大家。
1.什么是Node.js
Node.js 是一个基于 Chrome V8 引擎的 javascript 运行环境。
Node.js 使用了一个事件驱动、非阻塞式 I/O 的模型,使其轻量又高效。
Node.js 的包管理器 npm,是全球最大的开源库生态系统。
其实Node.js 就是JavaScript执行环境和JavaScript扩展的功能。
Node.js :一个可以运行JavaScript的平台,基于Chrome JavaScriptV8引擎,并且对JavaScript语言进行了增强,使JavaScript具有服务器语言开发的能力(操作文件,读取系统信息,网络等……)。
JavaScript:一门编程语言,只要有JavaScript引擎就能运行,各大浏览器都有自己的JavaScript引擎,并且如果JavaScript运行在浏览器中,浏览器对JavaScript加入了浏览器和文档操作的接口(方法)
2.node.js的优势
①前后端语言统一(JavaScript 理想状态)
②前后端分离(淘宝架构)
③前端开发工具很多都基于Node.js,只有会Node.js,使用起来才能得心应手
④社区活跃,上千个成熟模块供我们选择使用
⑤上手快,开发简单
⑥Node.js薪资高,人才少
3.Node.js安装与使用
下载:
英文:https://nodejs.org/en/
中文:http://nodejs.cn/
Windows系统下,选择和系统版本匹配的.msi后缀的安装文件。Mac OSX统下,
选择.pkg后缀的安装文件。默认安装即可
REPL方式运行
NodeJs提供了REPL模式(cmd命令行)( Read-Evaluate-Print-Loop,输入-求值 -输出 -循环),即交互式命令行解析器),可以直接在命令行,编写NodeJs代码,适合检验和学习nodejs。
js文件方式【推荐】
新建一个.js 文件,在命令行中运行。
4.Node.js的模块化
Node.js采用模块方式管理和组织代码,Node.js所有的功能都存在每个模块中。一个具有特定功能的文件就是一个模块,模块之间可能存在一定的依赖关系,使用模块可以很好的把这些依赖关系整合起来。
5.Node.js网络爬虫
下面是一个简单网络爬虫实现代码。当然看懂该代码需要一定的js基础的,如果你是小白建议你学习一下js基础。
代码简单,功能完美这就是node.js的强大之处。
这是网站爬下来的图片:
今天就分享到这里,简单易懂是笔者分享的初心,其实做网络爬虫Python也非常不错的技术,后期我也会分享一些Python相关技术。
你希望掌握永恒,那你必须控制现在。
以上是关于node.js网络爬虫之初识,技术诱惑。的主要内容,如果未能解决你的问题,请参考以下文章