学习工作记录三
Posted cafe3165
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学习工作记录三相关的知识,希望对你有一定的参考价值。
学习工作记录
这是第五周,国庆放假。前三天应我哥的要求回了老家,后四天便回学校学习去了。主要是看了一篇论文,又重温了一下项目的代码,还有就是给另一个项目打包ipa文件上架,由于对苹果证书内容的不熟悉,所以耽误了三天。。。
一 、 文献阅读
1.《知识表示学习研究进展》 刘知远
这篇文章主要是介绍了知识库领域的一些算法。内容比较丰富,重点研究了TransE及其改进算法。但是由于TransE在解决复杂关系建模问题上,处理的不好,比如:
假如知识库中有2个三元组,分别是(美国,总统,奥巴马)和(美国,总统,布什).这里的关系“总统”是典型的1-N的复杂关系.如果用TransE从这2个三元组学习知识表示,将会使奥巴马和布什的向量变得相同.
故为了解决这个问题,文章介绍了7种改进模型。
- 1.TransH模型(Knowledge graph embedding by translating on hyperplanes)
- 2.TransR/CTransR模型(Learning entity and relation embeddings for knowledge graph completion)
- 3.TransD模型(Knowledge Graph Embedding via Dynamic Mapping Matrix)
- 4.TranSparse模型(Knowledge graph completion with adaptive sparse transfer matrix)
- 5.TransA模型(TransA: An Adaptive Approach for Knowledge Graph Embedding)
- 6.TransG模型(TransG : A Generative Mixture Model for Knowledge Graph Embedding)
- 7.KG2E模型(Learning to Represent Knowledge Graphs with Gaussian Embedding)
另外,文章还讲了多源信息融合的实现——它是知识表示学习的另一个重要内容。因为目前的知识学习模型TransE 及其改进算法,无法有效地利用其它与知识有关的内容。尽管有关多源信息融合的研究比较多,但是与知识学习相结合的研究还是比较少的。
在文章最后,作者指出了知识表示学习的研究方向。主要提出了3个方面:
(1).面向不同知识类型的知识表示学习
(2).多源信息融合的知识表示学习
(3).考虑复杂推理模式的知识表示学习
其中3)是基于关系路径的推理学习,个人觉得还是比较有意思的。可以将知识库中部分相关的内容,通过某种推理加强它们的联系。
例如,根据三元组(康熙,父亲,雍正)和(雍正,父亲,乾隆)构成的“康熙”和“乾隆”之间“父亲+父亲”的关系路径,再结合三元组(康熙,祖父,乾隆),PTransE实际上额外提供了“父亲+父亲=祖父”的推理模式,从而提升知识表示的精确性.
还有文章最后提出了“面向大规模知识库的在线学习和快速学习”,也是比较有意思.
2.《中文社交媒体谣言统计语义分析》 刘知远
又是刘知远的文章,因为在知乎常看到他的大名,所以就去百度学术搜索了几篇来看一下他的研究方向。
文章主要是先介绍了谣言的种类以及传播特点。
然后提出面向社交媒体的自动辟谣框架。其中,在判断微博内容是否为谣言的时候,该文章提出了基于贝叶斯概率的可疑文章的概率计算公式:
最后,提出框架 :
3.一些概念的学习:张量、高斯混合
(1)张量(tensor):下面给两篇介绍比较清楚的文章:
文章中提到的Dan Fleisch介绍张量的视频,我听不懂。。。(菜),但是看文章1中的介绍,还是比较清楚的。特别是将张量具体成我们学过的三维空间,进而推广到n维空间这个过程。
一阶(1*3矩阵):
二阶(3*3矩阵):
三阶:
可以看作一个立方体
四阶:
五阶:
六阶:
What‘s a Tensor? 有空的时候翻译一下,^_^
(2).高斯混合(GMM,Gaussian mixture model)
从前学数据挖掘的时候,学过聚类分析,高斯混合模型是其中的一种,但是并没有教,当时主要教的K-means等。那么什么是GMM呢?
给两篇写得比较清楚的文章:
简单来说,对于一些聚类,可以使用多个独立的高斯分布模型,进行线性组合。利用如下公式:
分布概率是K个高斯分布的和,每个高斯分布有属于自己的μ和σ参数,以及对应的权重参数,权重值必须为正数,所有权重的和必须等于1,以确保公式给出数值是合理的概率密度值。换句话说如果我们把该公式对应的输入空间合并起来,结果将等于1。
权值和为1故称为线性组合。
如果只使用一个二维高斯分布来描绘,显然不够准确,我们可以很明显得看到下方数据可以聚成另一个类。
所以我们采用两个高斯分布组合成一个高斯混合模型,这样能更准确地刻画数据分布。
二 、 基于知识图谱的智能家居项目进展
本周主要是将该项目所有代码都看过一遍了,明确了该项目目前的不足,以及项目的完成度。
接下来的任务,等和学姐导师讨论完再决定吧。
需要尽快熟悉spring框架,感觉因为neo4j而使用spring 框架很奇怪。
三 、 下周工作内容
- 论文3篇
- 环境配置+运行+找导师讨论
- 牛客 PAT 3题(做满20题牛客给50元PAT抵用券嘻嘻嘻嘻)
- 检索课程的实验报告,第七周交中期报告,第八周交最终版
- 组合数学第二章(都没看,感觉丢人)
四 、 工作心得
1.国庆玩耍
虽然国庆只回去了3天,但还是在最后一天去了景点——壶公山。每次坐车去市区都会经过,但是都没有登上去过,这次直接开车上山~并在山上发现了一个很神奇的东西:
哈哈哈哈,我竟然捐了十万。。。唉,我要是真有十万就好了。。。
不过风景还是不错的~~~
2.苹果p12推送证书问题
在APICloud平台上云编译打包ipa文件的时候,忘记了苹果的推送证书是放在服务器上……
傻乎乎拿去打包ipa文件,编译了40个版本[捂脸]。一开始以为Mac的CA有问题导致签名证书无法识别,然后改用Windows用OpenSSL自签名产生证书,发现还是不行。问遍论坛和stackoverflow,都没发现问题(可能是太弱智了吧),最后还是靠au大佬提了醒。白花了一百多买他的打包软件了,买了个苹果开发者账号还花了我99刀
所以苹果三种证书的区别如下,另外,我专门写了一篇关于苹果证书的博客:
以上是关于学习工作记录三的主要内容,如果未能解决你的问题,请参考以下文章