学习工作记录三

Posted cafe3165

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学习工作记录三相关的知识,希望对你有一定的参考价值。

学习工作记录

这是第五周,国庆放假。前三天应我哥的要求回了老家,后四天便回学校学习去了。主要是看了一篇论文,又重温了一下项目的代码,还有就是给另一个项目打包ipa文件上架,由于对苹果证书内容的不熟悉,所以耽误了三天。。。

一 、 文献阅读

1.《知识表示学习研究进展》 刘知远

这篇文章主要是介绍了知识库领域的一些算法。内容比较丰富,重点研究了TransE及其改进算法。但是由于TransE在解决复杂关系建模问题上,处理的不好,比如:

假如知识库中有2个三元组,分别是(美国,总统,奥巴马)和(美国,总统,布什).这里的关系“总统”是典型的1-N的复杂关系.如果用TransE从这2个三元组学习知识表示,将会使奥巴马和布什的向量变得相同.

技术分享图片

故为了解决这个问题,文章介绍了7种改进模型。

  • 1.TransH模型(Knowledge graph embedding by translating on hyperplanes)
  • 2.TransR/CTransR模型(Learning entity and relation embeddings for knowledge graph completion)
  • 3.TransD模型(Knowledge Graph Embedding via Dynamic Mapping Matrix)
  • 4.TranSparse模型(Knowledge graph completion with adaptive sparse transfer matrix)
  • 5.TransA模型(TransA: An Adaptive Approach for Knowledge Graph Embedding)
  • 6.TransG模型(TransG : A Generative Mixture Model for Knowledge Graph Embedding)
  • 7.KG2E模型(Learning to Represent Knowledge Graphs with Gaussian Embedding)

另外,文章还讲了多源信息融合的实现——它是知识表示学习的另一个重要内容。因为目前的知识学习模型TransE 及其改进算法,无法有效地利用其它与知识有关的内容。尽管有关多源信息融合的研究比较多,但是与知识学习相结合的研究还是比较少的。

在文章最后,作者指出了知识表示学习的研究方向。主要提出了3个方面:

(1).面向不同知识类型的知识表示学习

(2).多源信息融合的知识表示学习

(3).考虑复杂推理模式的知识表示学习

其中3)是基于关系路径的推理学习,个人觉得还是比较有意思的。可以将知识库中部分相关的内容,通过某种推理加强它们的联系。

例如,根据三元组(康熙,父亲,雍正)和(雍正,父亲,乾隆)构成的“康熙”和“乾隆”之间“父亲+父亲”的关系路径,再结合三元组(康熙,祖父,乾隆),PTransE实际上额外提供了“父亲+父亲=祖父”的推理模式,从而提升知识表示的精确性.

还有文章最后提出了“面向大规模知识库的在线学习和快速学习”,也是比较有意思.

2.《中文社交媒体谣言统计语义分析》 刘知远

又是刘知远的文章,因为在知乎常看到他的大名,所以就去百度学术搜索了几篇来看一下他的研究方向。

文章主要是先介绍了谣言的种类以及传播特点。

技术分享图片

然后提出面向社交媒体的自动辟谣框架。其中,在判断微博内容是否为谣言的时候,该文章提出了基于贝叶斯概率的可疑文章的概率计算公式:

技术分享图片

最后,提出框架 :

技术分享图片

3.一些概念的学习:张量、高斯混合

(1)张量(tensor):下面给两篇介绍比较清楚的文章:

1.通俗易懂说“张量”

2.怎么通俗地理解张量?

文章中提到的Dan Fleisch介绍张量的视频,我听不懂。。。(菜),但是看文章1中的介绍,还是比较清楚的。特别是将张量具体成我们学过的三维空间,进而推广到n维空间这个过程。

一阶(1*3矩阵):

技术分享图片

二阶(3*3矩阵):

技术分享图片

三阶:

技术分享图片

可以看作一个立方体

技术分享图片

四阶:

技术分享图片

五阶:

技术分享图片

六阶:

技术分享图片

What‘s a Tensor? 有空的时候翻译一下,^_^
(2).高斯混合(GMM,Gaussian mixture model)

从前学数据挖掘的时候,学过聚类分析,高斯混合模型是其中的一种,但是并没有教,当时主要教的K-means等。那么什么是GMM呢?

给两篇写得比较清楚的文章:

1.一文详解高斯混合模型原理

2.高斯混合模型(GMM)及其EM算法的理解

简单来说,对于一些聚类,可以使用多个独立的高斯分布模型,进行线性组合。利用如下公式:

技术分享图片

分布概率是K个高斯分布的和,每个高斯分布有属于自己的μ和σ参数,以及对应的权重参数,权重值必须为正数,所有权重的和必须等于1,以确保公式给出数值是合理的概率密度值。换句话说如果我们把该公式对应的输入空间合并起来,结果将等于1。

权值和为1故称为线性组合。

如果只使用一个二维高斯分布来描绘,显然不够准确,我们可以很明显得看到下方数据可以聚成另一个类。

技术分享图片

所以我们采用两个高斯分布组合成一个高斯混合模型,这样能更准确地刻画数据分布。

技术分享图片

二 、 基于知识图谱的智能家居项目进展

本周主要是将该项目所有代码都看过一遍了,明确了该项目目前的不足,以及项目的完成度。

接下来的任务,等和学姐导师讨论完再决定吧。

需要尽快熟悉spring框架,感觉因为neo4j而使用spring 框架很奇怪。

三 、 下周工作内容

  • 论文3篇
  • 环境配置+运行+找导师讨论
  • 牛客 PAT 3题(做满20题牛客给50元PAT抵用券嘻嘻嘻嘻)
  • 检索课程的实验报告,第七周交中期报告,第八周交最终版
  • 组合数学第二章(都没看,感觉丢人)

四 、 工作心得

1.国庆玩耍

虽然国庆只回去了3天,但还是在最后一天去了景点——壶公山。每次坐车去市区都会经过,但是都没有登上去过,这次直接开车上山~并在山上发现了一个很神奇的东西:

技术分享图片

哈哈哈哈,我竟然捐了十万。。。唉,我要是真有十万就好了。。。

技术分享图片

不过风景还是不错的~~~

技术分享图片

2.苹果p12推送证书问题

在APICloud平台上云编译打包ipa文件的时候,忘记了苹果的推送证书是放在服务器上……

傻乎乎拿去打包ipa文件,编译了40个版本[捂脸]。一开始以为Mac的CA有问题导致签名证书无法识别,然后改用Windows用OpenSSL自签名产生证书,发现还是不行。问遍论坛和stackoverflow,都没发现问题(可能是太弱智了吧),最后还是靠au大佬提了醒。白花了一百多买他的打包软件了,买了个苹果开发者账号还花了我99刀

技术分享图片

所以苹果三种证书的区别如下,另外,我专门写了一篇关于苹果证书的博客:

关于打包ipa文件以及苹果证书的若干问题

技术分享图片

以上是关于学习工作记录三的主要内容,如果未能解决你的问题,请参考以下文章

学习工作记录五

Git学习记录

工作记录三-mesos-dns

产品需求文档的学习记录

React工作记录三十一dva.js初识

三分钟了解Activity工作流