广外数据挖掘实验室2018年招新开始啦!
Posted 广外数据挖掘实验室
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了广外数据挖掘实验室2018年招新开始啦!相关的知识,希望对你有一定的参考价值。
新学期已经拉开帷幕。
还在为大学生涯感到迷茫?
不满足于课堂上的基础知识?
想要提升自己的动手能力和创新能力?
想要揭开人工智能、深度学习的神秘面纱?
那么,有一个地方很适合你。
赶紧加入树蛙大家庭吧!
1
实验室简介
广外数据挖掘实验室成立于2006年10月,是由教师引导、学生自主管理,专注于数据挖掘技术应用及前沿研究的创新型组织。主要培养对象是对数据挖掘、社会网络分析和自然语言处理等研究领域感兴趣的在校学生,以学术科研为主导,以强化成员兴趣、锻炼学生的创新意识和动手能力为目标。实验室从成立至今有近400位学生在团队中学习过;目前实验室成员超过100人。
2
实验室成果
实验室10多年来一直专注于数据挖掘领域的相关研究及应用,通过以科研兴趣为导向组织成员开展科研项目,取得了一系列显著的成果。其中发表学术论文近50篇,其中SCI收录4篇、EI收录12篇、CSCD/CSSCI论文37篇;申请软件著作权21项,成功申请国家级、省级及校级科研项目62项,获得“挑战杯”广东大学生课外学术科技作品竞赛奖励8次,获得泛三角安利杯、全国大学生计算机大赛、粤港澳计算机作品赛、广东省软件作品竞赛共计43项;获得国家奖学金7人次;成员参与指导老师5项国家级科研项目和6项省部级科研项目;2012年团队获得广外最高荣誉“校长奖章”荣誉称号。仅在2017和2018年,实验室成功申请省级、国家级项目共8项,软件著作权6项,获第17届亚太信息通讯科技大奖赛Merit奖、第十五届“挑战杯”省赛特等奖和国赛三等奖、2017全国大学生计算机作品赛一等奖等。
3
主要项目组介绍
“一带一路”项目组
指导老师:蒋盛益(教授,博士)
项目组立足于“一带一路”战略背景,主要收集马来群岛国家(印度尼西亚、马来西亚、菲律宾、新加坡、文莱、东帝汶)主流媒体(汉语、英语、印尼语、马来语)以及全球英语、汉语主流媒体中的涉华报道,建立马来群岛国家国情库,运用数据挖掘和自然语言处理技术,对数据进行处理和分析,探索印尼语、马来语的自然语言处理技术。曾获两项国家级软件著作权,计算机设计大赛国赛二等奖等奖项。现承研项目有大创省级项目一项、广州市创新创业重点项目一项、广东省攀登计划两项,主要研究内容为多语种舆情分析、印尼语纠错技术研究、印尼语平行语料库与可比语料库构建、马印词性标注技术研究、马印语种差异研究、印尼语词形还原技术与分级研究。
“社会情绪分析”项目组(”Social Emotion Analysis”Group)
指导老师:蒋盛益,王连喜
项目组主要是通过构建并扩充情绪词典,对新闻评论进行特征提取与情绪类别分类,来分析公共事件本身及其体现出来的情绪倾向。以此为政府机构、事业单位、各类企业、互联网用户提供专业的舆情监测和预警服务。目前项目组主要着手于两个项目,分别是高校舆情项目和社会反向情绪项目。“高校舆情”项目主要面向高校进行舆情分析,爬取有关高校的数据,通过聚类分析、事件评价对象抽取、立场检测、观点挖掘、热度分析、高校网络影响力分析等研究,对高校舆情事件进行多维度的分析和评估,力求为高校管理层提供高校舆情的专业分析,作为学校及有关部门进行保障高校正常秩序和形象决策的参考。““社会反向情绪”项目旨在通过对官方报道和社交媒体评论的情感分析,筛选出反向情绪事件,从而遏制反向舆论,降低社会风险。该项目曾获得项目申报大赛二等奖。近年来项目组成果颇丰,曾获得“挑战杯”省赛特等奖、国赛三等奖,“我行我数”大数据应用大赛冠军,“中信杯”省赛二等奖等。
“电影数据分析”项目组
指导老师:蒋盛益
项目组通过电影影评和历史数据构建相应分析模型,对电影观影者进行用户画像刻画并对电影票房进行预测,深入电影行业为电影制片、发行提供决策方案,减少电影投资的风险。目前,项目组主要着手三个方面,分别是用户画像分析、用户兴趣挖掘和主创票房号召力模型构建。用户画像分析针对观影用户一系列真实数据构建并研究目标用户画像模型,分析与预测用户的基本属性与行为特征。用户兴趣挖掘通过爬取用户的电影评论,识别影评中兴趣关键词,挖掘影迷对电影关注倾向(包括话题识别、偏好以及情感极性分析等)。主创票房号召力模型构建则通过挖掘电影主创(演员)数据,分析主创(演员)对电影票房的影响因素并构建模型,实现对主创(演员)票房号召力的量化,为进一步预测电影票房提供数据参考。项目组曾获2017泛珠三角+“中星杯”计算机作品赛金奖,第17届亚太信息通讯科技大奖赛Merit奖,SMP CUP 2017用户画像测评第四名等。
“自然语言处理”项目组
指导老师:李霞(教授,博士)
李霞老师主持完成国家自然科学基金项目、广东省科技计划项目、教育部人文社科基金项目等多项课题;多年来讲授《自然语言处理》和《数据挖掘》课程,并在“语言工程方向特色班”中新开设《Python语言工程实践》课程;指导小组同学获全国计算机设计大赛一等奖、获广东省大学生创新创业项目、广东省攀登计划项目等立项;指导小组同学在《北京大学学报》、《中文信息学报》、NLPCC2017等期刊或自然语言处理学术会议上合作发表核心论文多篇。该小组目前主要在研项目包括:“基于深度学习技术的作文自动评分技术研究”、“面向小语种的跨语言技术研究”、“跑题检测技术研究”、“问题分类研究”等。
“计算语言学”项目组
指导老师:丘心颖(副教授,博士)
计算语言学是指通过建立形式化的数学模型,来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程。计算语言学作为科学研究的目的,旨在发现语言的内在规律、探索语言理解和生成的计算方法、建设语言信息处理的基础资源。小组目前的研究方向为多语言信息处理与分析,主要在研项目包括:(1)汉语文本可读性计算;(2)非通用语种语料库构建;(3)多词表达的自动提取;小组成员参与广东省信息安全院士工作站合作的技术研发项目“面向网络空间安全领域的垂直搜索与信息提取机制研究”,研发的系统用于相关单位的信息采集与分析,并申请多项软件著作权。在参与指导老师的论文研究中,成果发表在国际计算语言学大会(COLING)和全国信息检索学术会议(CCIR)。目前小组完成科研项目包括:“基于深度学习的非通用语种双语词典自动构建”,“双语句对齐人工标注辅助系统”等。并获第十三届“挑战杯”大学生课外学术科技作品竞赛,省级三等奖(2017),同时入选广东省大学生科技创新培育专项(“攀登计划”)项目(2017)。
“低资源语言处理”项目组(“Low-Resource Languages Processing” Group)
指导老师:刘伍颖(副教授,博士,云山学者)
本项目组主要从事“稀缺语言资源建设”和“低资源语言计算技术研究”。目标语种包括印尼语、马来语、日本语、韩国语、越南语、俄语、藏语、维吾尔语等;承研项目包括“国家语委重点项目(ZDI135-26)面向21世纪海上丝绸之路的稀缺语言资源建设及应用研究”、“广东省高校特色创新项目(2015KTSCX035)韩国语自动文摘关键技术研究”、“广东省哲学社会科学重点实验室招标项目(LEC2017WTKT002)马来语通用词汇资源半监督构建研究”、“广州市人文社科重点研究基地重点项目(2017-IC-02)城市公共事件的舆情治理模型与决策支持系统研究”;正在进行“TREC评测”、“LoReHLT评测”、“基于紧急事件情景框架的印尼语多文档文摘关键技术研究”、“基于超算平台的印尼语汉语神经机器翻译关键技术研究”、“城市公共事件案例库构建”、“马来语(印尼语)语音学习平台开发”。
“智能语言处理”项目组
指导老师:周咏梅教授、唐明董教授(云山学者)、彭三城教授(云山学者)。
指导老师主持国家社科项目、国家自科项目、教育部项目、科技计划项目等多个项目。项目组研究方向为:利用人工智能技术(机器学习、深度技术)对大规模短文本(微博、微信、评论)理解分析的理论及其应用进行研究。近期主要研究内容为:利用机器学习方法进行文本表示研究、基于大规模文本的概念图谱构建、文本情感分析、社会情绪演进分析、企业口碑预警分析、社交网络分析、软件网络分析、软件智能化开发技术等。本科生可以通过参与这些研究内容申报大学生创新项目及各种竞赛项目。
招新要求
学习、工作积极主动
乐于奉献,懂得感恩,有强烈的责任感
能吃苦耐劳、有毅力,愿意投入较多时间和精力
对自然语言处理和数据挖掘有浓厚的兴趣
对编程、设计、数学感兴趣者优先
招新计划
招新面向广外信息学院2017级的同学们。简历经过老师审阅后会公布面试名单,面试合格者确定候选名单,经培训及暑假实训,确定最终名单。在水平相当的情况下,软件工程专业语言工程特色班和网络空间安全专业内容安全方向的同学优先。目前我们有以下项目组提供招新名额:
“一带一路”项目组(指导老师为蒋盛益、王连喜,拟招3~5名2017级同学)
“社会情绪分析”项目组(指导老师为蒋盛益,拟招2~3名2017级同学)
“电影数据分析”项目组(指导老师为蒋盛益,拟招2名2017级同学)
“自然语言处理”项目组(指导老师为李霞、路美秀,拟招8~12名2017级同学、1~3名2016级同学)
“计算语言学”项目组(指导老师为丘心颖老师,拟招6~10名2016级和2017级同学)
“低资源语言处理”项目组(指导老师为刘伍颖,拟招10名2016级或2017级同学)
“智能语言处理”项目组(指导老师为周咏梅、唐明董、彭三城,拟招2017级和2016级学生若干名)
招新流程
请有意者将报名表填写完后发送到shujuwajueiiip@163.com,并抄送相应项目组指导老师,邮件主题和附件均命名为“学号-姓名-2018数挖招新 XXX 项目组”,若有其他相关附件请命名为“相关资料-姓名”。报名截止日期:2018年3月31日24:00:00,面试时间另行通知。(点击“阅读原文”下载报名表)
各项目组指导老师联系方式:
蒋盛益:jiangshengyi@163.com
丘心颖:xq.qiu@foxmail.com
李霞:dm_nlp@126.com
刘伍颖:wyliu@gdufs.edu.cn
唐明董:201610127@oamail.gdufs.edu.cn
以上是关于广外数据挖掘实验室2018年招新开始啦!的主要内容,如果未能解决你的问题,请参考以下文章