随笔记︱12月9日R语言大会速记(自然语言专场)
Posted 素质云笔记
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了随笔记︱12月9日R语言大会速记(自然语言专场)相关的知识,希望对你有一定的参考价值。
多 图 预 警 。
R语言大会是上学的时候就特别喜欢的我们专业的会议,也在不断适应时代的变迁,今天到华东师范大学听了听,本来以为是‘怀旧’,没想到还见着一些不错的case。
1、一鱼科技 -网络文学文本挖掘
网络文学IP挖掘的一家公司,帮助寻找网络文学、网剧的一些热门IP。
对于他们来说,核心的技术点就是未登录词识别,因为网络IP新词特别多。
用的是比较传统的信息熵的方式去做统计,观点词抽取也用的是TFIDF/TEXTRANK之类的,属于做法传统的一家公司了。
2、奇点科技 - AI机器人
这家是我觉得最有价值的一次,因为他从AI创业者的角度给算了一笔账。
这笔账里面是什么技术都买,不自己研发的情况下,需要投入的费用是:
443.7万。用血淋林的数字告诉创业者,AI创业之路维艰,当然因为他们要做硬件注定了成本会很高,怪不得现在很多公司转向做AI服务,成本会可控不少。。。
拆分一下细则(还有些没记。。):
研发 - 语音成本:科大讯飞软件 + 其他厂家硬件 = 36900元/年
研发 - 知识图谱:直接买图灵机器人,299元/年
研发 - 语言理解API:腾讯AI平台
研发 - NLP工程师:2.5w月薪的话 + 企业缴税 ,13万元/人/年
维护 - 最低配分布式服务器:6.9万/年 阿里云
产品 - 基本一款产品
营销 - 微信入口一个成功推广成本在80元,覆盖成本需要36975用户,那么营销成本在295.8万元。
以科大讯飞的语音成本来计费。
腾讯的文本理解,6.21万元。
产品端
营销
最后演讲者作为AI创业提到了,现在AI要变成产品,主打的口号还是AI的话,那么已经没有什么竞争力了,要从以下各个方面去差异化才方有可能突破寒冬。
这点对AI创业来说,非常有用!
3、追一科技 - AI智能客服
应该属于明星队,创始人从腾讯绝艺出来的,AI能力应该很强。
技术倒是只有几张PPT,而且多轮对话这边基于任务来做,做的还是挺普遍的东西。倒是主打的是:自学习智能。
今天的分享内容倒是一些案例,笔者看来干货不多。
专业内容不多,倒是笔者之前收集过一份他们做BERT的实验探索。
会在之后贴一下。
4、追一科技 - google bert模型解析及实验探索
笔者在这截取几页比较有意思的内容。
双向编码与网络深度的冲突性问题
BERT整体架构
BERT - fune-tuning方式
实验观察与结果
需要PPT的可后台回复‘追一科技’拿到这份PPT。
以上是关于随笔记︱12月9日R语言大会速记(自然语言专场)的主要内容,如果未能解决你的问题,请参考以下文章
2017 BDTC大会,巨杉出品金融级分布式架构专场,邀您参加!