维度孤岛与评判标准

Posted 泰 戈 尔

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了维度孤岛与评判标准相关的知识,希望对你有一定的参考价值。

一维、二维、三维

20215.12 写了一篇 《借助余弦相似度辅助背单词》,并申请了专利。这两天突然回想起来,余弦相似度不仅仅可以拿来背单词,实际上,这个理论可以应用的层面还是很多的。

还记得小时候,俺妈经常对我说: “要多向学习好、品德好的孩子学习,别整天和调皮捣蛋的混。” 可能你会觉得这段话比较耳熟,毕竟中国大多数的家长都会对自己的孩子这么说。

那究竟怎么判断一个小孩儿是可以一起玩耍的伙伴呢?这个标准是什么?我想,这就是 维度。不管是人,还是物品,都会有成千上万的层面与其同类进行区分。对不同的人来说,千人千面,对一件事物的看法也会是各式各样的。

我们作为社畜中最平凡的一员,免不了和别人打交道,试着感受一下,下面描述的几种场景:

  • “借钱”: 都说好借好还再借不难。张三借了我的钱,要了几次都不还,甚至还躲着我;李四借了钱,按时归还不说,还顺带送了点小礼物以表感谢。
  • “让座”:“我”是一个公交司机,某天正驾驶海淀 932 路公交车在路上行驶,目前车上还剩一个老弱病残专座,这时上来一个老人,一个青年。青年有两种选择,自己坐、让给老人。不同的选择,对我来说,对青年就会有不同的评判。按中华传统美德,是该让座。但让与不让,全凭个人态度。
  • “甩锅”: 在职场,甩锅的事屡见不鲜。开发与测试之间的关系很微妙,有的相处很融洽,有的却似针尖对麦芒。我曾亲身经历过,项目上线出问题了,结果相互甩锅的事。作为当事人,对方的态度决定了以后我们双方的合作走向。

“物以类聚,人以群分” ,是“标签化”的感觉,我觉得这也便是对 维度 的一个比较好的体现。废话不多说,我想表达的其实就是:

我们每一个人身上都有很多可以测评的层面,这一个个的层面评判的汇聚,其实就代表了我们对某个人的整体看法。

我曾梦到过这样的画面:
在一个沙盘上,每个人都是一个个的孤岛,有的高,有的低,孤岛的名字代表了一个个特征(如 性别、身高、体重、帅/普通/丑等等),而海平线则是衡量这些个特征的标尺。

当我想找体重 65KG,身高低于180 cm的长相普通的男生时,通过这个“标尺”便可以进行评估,然后过滤出符合标准的“孤岛”。然后通过成千上万的特征筛选,最终我找出了一个叫“泰戈尔”的孤岛。

这个过程,和本文开头的《借助余弦相似度辅助背单词》介绍的理念,有异曲同工之妙,无非是将单词的词向量更加抽象画,转换为个体本身所归属的一个个的特征。

我在想,在未来会不会有这样的情景出现:

借助大数据,对每一个人进行建模。

  • 每个人在交朋友之前,先通过余弦相似度匹配算法对这个人进行评估,来评判能否成为朋友。
  • 大学录取考生时,通过此算法进行学生素质及潜力评估,来作为是否能否录取的标准。
  • 相亲网站,通过此匹配计算,寻找那个最合适的 TA。

想想,这些场景似乎并不遥远,撇开道德约束,有些场景甚至已经有人在偷偷地实现了。是不是还挺可怕的,这种场景下,人还有隐私不😂

以上是关于维度孤岛与评判标准的主要内容,如果未能解决你的问题,请参考以下文章

维度孤岛与评判标准

在查询层面统一时序数据和关系数据可消除数据孤岛

张宏江:开源时代如何解决人的思维孤岛

数据仓库或孤岛数据集市

差距和孤岛问题 - 查询不适用于所有时期

聚焦丨世纪之症 -数据孤岛