谈谈信息挖掘
Posted caoz
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了谈谈信息挖掘相关的知识,希望对你有一定的参考价值。
众所周知,TK教主是搜索引证的达人,在技术高手的成长路线里,善于使用搜索引擎一定是最基本的能力诉求。
旧文也多次提过,有价值的信息往往碎片化,往往如面包屑隐藏在不同角落里,如何搜索,整理,判断,归纳,就显得尤为重要。
而信息越完整,那么旧文也提过,关键决策的支持也就越完整,决策的准确性也就越高。
那么到底,怎样才算是信息挖掘。
前几天,我直播的时候,拿自己的习惯做了一个案例,但不知道什么原因,被系统以异常为由终止了直播。
友情提醒,本文所有内容仅为信息挖掘案例展示,不作为任何投资决策建议。
案例:
最近好奇大阪的房产投资,所以做了一些功课,跟大家分享一下我的信息采集和整理的思路。
第一,为什么考察大阪。
1、相对于东京而言,大阪的房价只有1/3到1/2,但作为关西最大城市,以及热门旅游目标,其出租回报和东京的差距并没有房价那么悬殊。整体出租回报率,从表面来看,非常可观。
该部分后续再展开。
2、新加坡的银行可以为客户购买大阪房产提供贷款,并且有一定利率优势。
3、日本法律相对规范,代理机构相对可信任,政局相对稳定,相对于东南亚地区的一些新兴小国,长期风险相对可控。
4、疫情期间,有一定的低估价值,疫情结束后,存在报复性旅游的可能性。除了中国游客外,无论是东南亚游客,还是欧美游客,都有非常多人热衷于大阪旅游。
这里,1和2属于基本信息的采集,其中存在一定的道听途说,需要进一步的核对和验证。而3和4属于基本认知和常识。当然,有人如果不承认这是常识,没关系,此部分仅作案例完整性陈述使用,不争论。
第二,如何搜索房源
搜索海外资源,默认谷歌。
如果用中文搜索,多半会发现一个叫做神居妙算的中文日本房产平台,那么用英文搜索,也会找到一些当地的房产网站,但这些是否是最完整的呢?
换一种搜索方式,搜索“日本最大的房产网站”,找到一些讨论是suumo。不过是全日文的,也就是正常情况下我们是搜索不到的,那么全日文网站能不能使用,当然能,因为有“谷歌翻译”,在chrome浏览器右键即可全站翻译。基本内容理解起来是没有问题的。
对比房源,确实比“神居妙算”这样的中文平台内容充实。
不同平台的房源有些是重复的,但有些也是各自平台独有的。
第三,关于信息深挖
找到了房源信息,价格,地段,面积,是不是就可以做出足够的对比了,这仅仅是开始。
这里补充一句,关于房产持有的税费,很容易搜索到,属于基本信息,不赘述。
3.1 搜索不同城区的房价对比和区域特征对比。
红灯区房价相对很低,治安也相对较差,流浪汉多。
北区是新发展区,金融中心和信息产业。
大阪大学所在是北部。
东区外国人较多。
中央区,浪速区,天王寺区属于传统旅游和商业区域,游客较为集中。
等等。
以上,搜索“大阪城区房价对比”,能找到不少。
3.2 不同区域人群构成和政治倾向构成
非常有意思,我还查了"大阪特区公投"的倾向性分布图,这个有一定代表性,可以了解不同区域主要居民,是偏向革新,还是偏向保守,那么这也会多少影响到该区域未来的发展活力。
3.3 不同区域的房租对比。
房价对比和房租对比,可以更好的理解租售回报的比例。
这些是基本信息,也是很多人可以想到的,但这些足够了么?
并不够,其实房源信息里提及的很多关键词,要有好奇心,那么基于这些关键词,继续深挖,就会看到更多有价值的信息。
比如某些房源价格明显低于同地区行情价,那么通常都是有原因的。
3.4 所谓土地类型和最高容积率
发现有第一类居住区,第二类居住区,商业区,工业区等等。
那么第一类是低密度优质住宅区,第二类就普通一些,是不是第一类住宅区更好呢,未必。因为这种地块商业配套往往不够好。如果不是自住,而是出租给游客和普通人,可能不如第二类居住区方便。
商业区可以有更高的容积率,可以开店铺,通常价值更高,但是仔细阅读条款其实是有风险的,居住区的采光权是有一定保障的,但是商业区就不是了,所以如果不仔细调查周边,有可能是被高楼包围,暗无天日的地块。
3.5 所谓建筑许可
防火区域,半防火区域,这个和普通区域区别在哪里。
日本一户建大部分是木造结构,成本较低,但是防火区域就不允许木造结构,只能做钢混结构,那么建造和改建成本都会比木造高很多。
再建筑许可。有些老房子是禁止再建的,因为不符合新的建造法,可能这种地块后续维护就比较烦,虽然也允许翻新,保留主体结构即可,但毕竟不能为所欲为的改造房产,特别是这种都是很老的结构,所以这种往往价格显著低于市场价。
3.6 谷歌卫星和谷歌街景
看到房源信息和所在区域,要查看地图周边,那么谷歌街景和谷歌卫星其实是价值是非常巨大的。你只看地图,可能大概知道这个房产的位置和区域,但是街景可以看到周边的真实情况,比如前面提到的,采光,以及,是否可能存在较多噪音污染。还有很重要的一点,我也看到一些显著低于市价的市中心区域房源,那么用卫星地图和街景才注意到,背后是一些神社,而里面则是密密麻麻的墓地。换句话说,这个房子是无遮坟景房,这种你从公开的信息图片是看不到的,如果无法去现场考察,或者现场无法深度调查(比如只允许在前面参观,以租客的名义不允许进入内部查看视野),那么谷歌卫星非常有用的。
3.7 民宿许可
大阪允许全年民宿营业,但这里有一个问题,所谓允许,其实是需要邻里同意才可以,而大部分公寓是禁止民宿进入的。
所谓许可,只代表该区域许可,不一定代表该房源许可。
3.8 城市发展规划和重点校区分布
政府官方网站和官方报告其实是最直接的资源,当然,还是需要谷歌翻译。
以上这些,都是通过房源信息内容展示中不同的关键词,那么基于这些关键词不断组合搜索挖掘出来的。
当然,在搜索之后,可以再联系会中文的中介,对不明确的信息进行进一步的咨询,这时候,问出来的问题就会显得相对专业,别人也会认为你确实有足够的准备,当然也会认真对待你的问题。
3.9
比如说,日常维护和管理的成本,代管费用,比如说,出租市场的行情,当你觉得出租回报率很好的时候,别忽视潜在的空租率。
这些可以通过进一步沟通深度了解,而且可以多咨询不同的中介,互相印证。
今天啰嗦这些,回到最初话题,是不是说鼓励大家投资房产,绝对不是。
我旧文有提。关于海外置业,我泼点冷水
今天的主题是,如何进行信息挖掘。
第一,好奇心很重要,你对某个领域有好奇,是驱动你深挖的动力源泉。
第二,学会寻找最有价值的信息源。信息源很重要,很多时候,有价值的信息存在于垂直领域的搜索平台里,你要先找到这个平台。
第三,对关键词敏感,浏览领域内文章,领域内信息的时候,看到有些关键词不是很理解,不是很明确,要去搜索确认。
这点极为关键,往往可以通过一个信息点,查阅的过程中不断发现新的关键词,不断扩展信息点,最后会成为很庞杂的知识树。
我旧文经常会留有一些面包屑,也就是某些关键词特征,有极少数的人可以通过自行搜索,拼凑出更多的丰富内容,也有人会说,我搜过了,找不到,其实很多是需要一些关键词组合,有些是内容提到的,有些可能需要脑补一下,比如你搜索什么领域的,那么特征关键词+领域标记词,可以很好的限定搜索范围,这本来应该是很常识的东西,但确实很多人并不擅长。
第四,多渠道信息比对,确定信息真伪,来源和完整性,有时候,某些渠道的信息不完整,可以通过识图搜索,或者其他关键词组合方式寻找其他渠道的同一信息,相互对照补充。
第五,建立信息之间彼此关联的逻辑。
比如前文所述,不同授权区域,不同建筑许可,不同周边环境对房价的影响因素等等。要建立一个关联影响的框架逻辑。
第六,必要的时候,寻求专业人士的见解。
前提是,做足功课。
你做足功课,别人也会重视你的咨询,比如前文所述,一个中介面对一个做足功课的咨询者,一定会认为对方有足够的交易意愿,当然会更积极的回复和交流。而且当发现对方有足够的信息储备,自然也不敢过于夸大其词。
互联网信息往往是碎片化的,那么你首先要明确,自己所期望的目标是什么,并建立最基本的目标逻辑框架。
比如房产投资,追求租金回报和追求升值,其底层逻辑是完全不同的。其所需要关注的信息重点也是完全不同的。
基本目标逻辑确认后,再根据所收集的信息,将各种影响及关联因素尽可能罗列,并且对每个影响因素的影响范围尽可能标注,并通过进一步的信息采集去修订。
当我们试图做出一些关键决策的时候,这些信息越完整,因素关系越清晰,对决策的效率越有意义。
数据控新加坡买车记,这也是一个范例,决策前的数据准备和信息挖掘,当时我劝身边朋友说,根据历史数据,coe会大涨,但是都没听我的,后来疫情特殊原因还下跌了一段时间,但很快就飙升了,从当时的推算逻辑来说,我的预判是没有问题的,疫情是个黑天鹅事件,仅仅是短时间影响。
做出重大决策,关键决策的时候,信息挖掘和采集都是非常重要的。然而现实中,很多人会一时头脑发热做出关键决策。此外,盲从所谓权威意见也是很危险的,甚至很多权威就是靠收割来实现其权威价值的。
最后,补充一句,以上案例所提到的信息采集,并不足以建立真正有效的决策支持。信息不对称所带来的风险依然存在。此外,世界多变,诸多黑天鹅因素会严重干扰决策效果。
以上是关于谈谈信息挖掘的主要内容,如果未能解决你的问题,请参考以下文章