数萃报道|网络爬虫与文本挖掘
Posted 数萃大数据
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数萃报道|网络爬虫与文本挖掘相关的知识,希望对你有一定的参考价值。
9月22-25日,由数萃大数据学院主办的网络爬虫与文本挖掘培训在人杰地灵的宁波顺利开展,此次专题培训在宁波维也纳国际酒店举办,共有三十名学员前来参加。
培训的开幕式上,数萃大数据学院院长汤银才教授向大家表达了热烈的欢迎,同时向大家介绍了数萃的大数据平台和团队。
此次培训的讲师为靳军和尹志老师,靳军是数萃未来科学家计划核心成员,精通python,熟练掌握R,有3年的R与python语言编程经验。研究兴趣集中在机器学习、网络爬虫、文本数据分析、sparkR及分布式计算,专注于用python进行量化策略构建。尹志老师是浙江大学物理学博士,青年学者,浙江宁波工程学院深度学习研究中心负责人,拥有10+年软件开发数据产品经验,熟悉RPythonjavascript等多种编程语言,目前研究集中在推荐系统、文本挖掘、神经网络等机器学习领域,具有丰富的统计建模、数据挖掘、大数据技术授课经验。
培训分为四个模块,分别是网络爬虫基础、数据爬取与存贮、网络爬虫提升以及文本挖掘。数萃金牌讲师靳军详细介绍了网络爬虫相关的基础知识、开发环境以及python的基础语法,并且进行了一系列的演示和案例介绍。数据科学家、宁波工程学院的尹志博士将自己丰富的网络爬虫与文本挖掘实战经验运用于课堂上,生动鲜活地将网络爬虫和文本挖掘的实操方法和技巧传授给大家。数萃的几位助教全程协助讲师解答学员遇到的各种疑惑。
为了使培训达到学员最满意的效果,我们在培训前后均有问卷调查,培训前的问卷调查旨在了解学员相关知识的掌握程度,以便讲师根据调查结果调整讲课的节奏和侧重点。培训后,我们调查了学员对培训的满意度,结果显示,学员对此次培训十分满意,给出了整体94%的满意度,表示收获很大,也对网络爬虫和文本挖掘有了更深入的了解。同时,学员们也提出了非常宝贵的意见,我们一定会吸取意见,以后为大家带来更好的培训体验,大家的支持和意见正是数萃进步的最大动力。
以上是关于数萃报道|网络爬虫与文本挖掘的主要内容,如果未能解决你的问题,请参考以下文章