《开拓者开发团队》第二次作业:基于弹幕评论的大数据分析平台项目开题报告
Posted lwdl
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《开拓者开发团队》第二次作业:基于弹幕评论的大数据分析平台项目开题报告相关的知识,希望对你有一定的参考价值。
一、项目申请简表
项目名称 |
基于弹幕评论的大数据分析平台 |
|||||||||||||||
项 目 类 别 |
本科生 |
研究生 |
||||||||||||||
学术课题项目填写标 记(√) |
( ) A、自然科学学术论文 (√ ) B、科技发明制作 ( ) C、社会科学论文与调查报告 |
类别 标记 ( ) |
( ) A、学术科研类项目 ( ) B、社会调查类项目 ( ) C、创新实践类项目 |
|||||||||||||
创新创业 项目填写 标记(√) |
(√)信息技术 ( )电子商务 ( )健康医疗 ( )新能源新材料 ( )跨境电子商务 ( )智能制造 ( )文化创意 ( )旅游时尚 ( )现代农业 |
|||||||||||||||
申请金额 |
30000 |
起止时间 |
2018-5-3至2018-6-20 |
|||||||||||||
申 请 者 |
团队组长 |
姓名 |
杜世康 |
性别 |
男 |
出生年月 |
1997.1 |
民族 |
汉 |
|||||||
专业 |
计算机科学与技术 |
入学时间 |
2015.8 |
|||||||||||||
学院 |
计算机科学与工程学院 |
联系电话 |
17793147249 |
|||||||||||||
主 要 成 员(不含申请者) |
姓 名 |
专业及年级 |
项目中的分工 |
签 字 |
||||||||||||
刘 丹 |
计算机科学与技术 三年级 |
后台开发 |
刘 丹 |
|||||||||||||
王静雅 |
计算机科学与技术 三年级 |
后台开发 |
王静雅 |
|||||||||||||
李玉莹 |
计算机科学与技术 三年级 |
后台开发 |
李玉莹 |
|||||||||||||
尹楠 |
计算机科学与技术 三年级 |
数据库设计 |
尹 楠 |
|||||||||||||
曹莹雯 |
计算机科学与技术 三年级 |
系统前台设计 |
曹莹雯 |
|||||||||||||
|
|
|
|
|||||||||||||
研 究项目 内 容 概 述 |
“基于弹幕评论的大数据分析平台”,利用国内知名的直播平台-斗鱼,通过其弹幕服务器第三方接入协议来爬取海量弹幕数据,作为一个实验的基础。对于弹幕数据做一个大数据的分析,并将实验数据通过echarts展示在大数据分析平台上。
|
|||||||||||||||
二、立论依据(项目定位)
随着互联网的不断发展和推进,网络在线直播视频,已经在人们观看视频过程中占据了主要地位,“弹幕”因其高互动性和娱乐性已经流行开来,而弹幕自身包含的丰富文本信息和与视频内容相关的时序性特征为数据挖掘提供了可能。而目前计算机领域对于弹幕研究的主要应用可概括为垃圾弹幕的识别和过滤,视频流行程度的预测,视频的自动标记,视频精彩片段的抽取等。
|
||||||||||||||||
三、研究方案
1、研究目标、研究内容和拟解决的关键问题 “基于弹幕评论的大数据分析平台”,利用国内知名的直播平台-斗鱼,通过其弹幕服务器第三方接入协议来爬取海量弹幕数据,作为一个实验的基础。预期的目的是利用Java多线程编程实现实时获取弹幕并能够通过大数据分析出一些基本的指标并直观展示出来,做一些简单的数据挖掘,如果进展顺利,也可以做类似精彩视频片段推荐这样更有意义的事!
2、拟采取的技术路线 拟定的技术路线为首先利用Java多线程编程来实时爬取海量斗鱼弹幕数据,其次利用Spginmvc,Spring data,H-ui搭建本次项目的主体框架并集成数据可视化工具Echarts体现大数据分析结果,最后利用Python制作数据诊断工具来了解特征的分布及基本的统计指标值,再有目的性的选择一些聚类,分类,文本挖掘算法对于弹幕数据做一个大数据的分析,并将实验数据通过echarts展示在大数据分析平台上。
3、项目进度时间安排 (文献查阅): 2018 年 5 月 3 日至 2018 年 5 月10日 (方案设计): 2018 年 5 月10日至 2018 年 5 月20日 (实验研究): 2018 年 5 月20日至 2018 年 5 月31日 (数据处理): 2018 年 5 月31日至 2018 年 6 月 5 日 (研制开发): 2018 年 6 月 5 日至 2018 年 6 月15日 (撰写论文或研究报告): 2018 年 6 月15日至 2018 年 6 月20日
|
||||||||||||||||
四、预期成果
对斗鱼平台的弹幕做一个大数据分析,自身定位是提供服务的第三方平台。目标用户可以是直播平台自身,通过海量弹幕数据去做针对斗鱼弹幕用户的用户分析,直播视频的推荐,深入点也可以精彩片段的推荐等,服务对象是直播平台自身。如果各大直播平台都提供开放的弹幕获取接口,预计用户量可以是各大直播平台。目标用户也可以是平台主播,例如:通过对弹幕数据的分析,做一个粉丝礼物贡献排行榜,弹幕活跃粉丝排行版,去增强主播和这些铁粉的联络互动。还可以通过弹幕文本分析指出主播的优缺点,再例如,对于爱看唱歌类直播的粉丝一般弹幕会刷歌名去要求主播献唱,而把这样的信息反馈给主播可以说是非常有价值的。这时候的服务对象就是各大主播了,而预计用户数量则不可估计
|
二、立项书github 地址: https://github.com/LWDLYC/xixi
以上是关于《开拓者开发团队》第二次作业:基于弹幕评论的大数据分析平台项目开题报告的主要内容,如果未能解决你的问题,请参考以下文章