证券研究中的量价时空:时光旅行流媒体与视频识别我眼中的计算机股(第二篇) (证券研究系列连载之四十五)
Posted 行业比较与缠论研究分析
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了证券研究中的量价时空:时光旅行流媒体与视频识别我眼中的计算机股(第二篇) (证券研究系列连载之四十五)相关的知识,希望对你有一定的参考价值。
作者简介:少年时做过电台播音主持,后留美多年,毕业于密苏里州立大学会计系和乔治华盛顿大学金融系,在高校里学习十年整,留学期间曾获全额奖学金,美国注册会计师,回国后在券商研究所担任研究员四年有余,目前主要从事以行业比较、缠论双策略为核心的股票投资策略体系研究。
前言:
双十一晚上寒冷的空气里满是干净峻爽的味道,我下班后换上西服,从浦东出发去徐汇参加一个相亲联谊活动,路上经过淮海中路,我正在专心考虑流媒体技术原理,在红灯处我抬起头看着街边琳琅满目的商场,跟司机感叹说这里好繁华啊。相对淮海路,我工作的浦东兰花路是比较偏僻的,我每天晚上10点下班以后只有一个水果摊和罗森便利店还开着。
在我刚念大学的秋天,我从来没有想过自己有一天会去相亲,那时的理想是看完学校图书馆里的一书架金融学书籍,我并不是因为别人说金融热门去学习这个专业,我只是想找到自己适合的方向,在这个领域里可以真正展现才华。那时我还曾经看过科幻电影《回到未来》三部曲,直到今天我仍然认为,美国最打动我的,是他们深邃的想象力与不断前进的精神。
很多年以后,我知道时光旅行在科学上确实是可能的,时间就像是一条河流,这条河流不仅可以弯曲,并且可以弯回到自己身上,所以在理论上,我们可以回到过去见到二十年前的自己。在1940年代,普林斯顿大学数学教授哥德尔发现了爱因斯坦方程式的一个微扰( disturbing)解,这个解允许在一个旋转的宇宙中进行逆向时光旅行,这是20世纪最重要的数学论文之一。一件我们都知道的事情是,高速移动的物体,其老化的速度会比位于实验室坐标系的静止物体来得慢,如果一个姑娘搭上接近光速的火箭到外层空间再返回,她可能会回到几千年后的地球。科学家已经用好几种方式验证了这种时间变慢或拉长的效应。在1970年代,科学家曾经把原子钟(atomic clocks)放上飞机,证明这些钟的确会比地球上的钟慢上一些。同样,时间在靠近非常巨大的质量时,也会被大幅地减慢。
有一个夜晚做科技股研究时,我查阅物理学文献,这种时光旅行的科学原理最早来自于狭义相对论中对于时间间隔的相对性讨论,假设高速列车车厢上有一个墨水罐,每隔一段时间滴出一滴墨水,车上的人测得在t’2 、t’1两个时刻在地面形成P、Q两个墨点,车上的人认为两个事件时间间隔为t’2 - t’1,地面观察者认为时间间隔。由于前文提及的长度的相对性,车上与地面观察者测得的P、Q两个墨点间距离是不一样的,所以根据狭义相对论长度相对性的关系式,可以推出两个时间间隔的关系式为:
其中Dt是与墨水罐相对静止的观察者测得的两次滴下墨汁的时间间隔。这种时间间隔相对性的关系式具有普遍意义,它意味着如果飞船速度非常快,接近光速时,则分母接近于零,Dt是Dt的无限倍数,就会出现“天上一天,地上一年”的效果,地面的时间流速比天上的时间流速快很多,因此若要使一个人获得无限的生命,他就需要坐在一个接近光速飞行的飞船中远离地球,即当火箭可能保持光速运动状态,离开地球,火箭中的宇航员在火箭上的每一秒都是地球上的漫长时间,宇航员的生命将不会通过时间来计算,而是随生理寿命的结束而结束。
一晃多年过去了,我读过了很多很多书,毕业后我的工作稳定下来,成为了一个股票策略分析师。当我过了三十岁,我开始羡慕那些在街头上走在一起相互依偎的情侣。在晚上的相亲联谊活动中,一个朋友跟我说,现在的女孩看的是男生的深度作品。于是双十一的晚上我继续写深度报告到很晚,只是下了订单买了一个SK-II套装。
正文:
第一部分、流媒体技术的探讨、高燃与Mysee
在计算机股票的研究中有两个主题让我印象深刻,第一个主题是上一期讲的云计算,第二个主题是流媒体技术。十几年前,我曾经看过很多美剧,当时是夜里用电驴下种子,往往第二天醒来,视频才能下载下来,同时这部电影可能根本不好看,即使事先不知道只能先下载,而现在视频在线播放功能则大大便捷了人们的生活。流媒体技术的运用为后来的小视频、直播以及游戏类公司的诞生奠定了基础。
提起流媒体技术,我总会想起创业明星高燃与Mysee,高燃与茅侃侃等人当年都曾经是八零后创业的典范,我念大学时常见媒体报道他的事迹。Mysee是土豆和优酷的老前辈,主营业务是P2P流媒体,它是一种新型的网络视频技术,可以让播放效果更流畅,成本更低,这种技术使人可以直接连接到其他用户的计算机并交换文件,而不是像过去连接到服务器去浏览与下载。这使一个宽带用户在线观看一部完整的电影发生的成本大幅降低,同时单个服务器可支持1万名以上用户同时在线。
这种流媒体技术在2005年国民党主席连战第一次访问大陆那天的互联网媒体转播中开始了广泛应用,不久后Mysee参与了一系列重大时事的网上直播,例如宋楚瑜来访、美国发现号航天飞机升空、“神舟六号”载人飞船发射,公司获得了几家风险投资机构的资金,合作伙伴包括新浪、搜弧、网易等大型门户网站以及中国电信和中国网通,这一切显得如此顺理成章。
Mysee网后来成为一个能免费看电影和电视的网站,在这里,用户能直接体验P2P技术带来的视觉享受,画面流畅而清晰,不像大多数网络电视那样断断续续。不过遗憾的是,由于Mysee的高清需要安装他们自己的插件,而且这样的网站层出不穷,比如土豆、优酷类的网站不用插件就能播放较清晰的视频,在这种竞争中 Musee又没有采取相应的措施,导致其于2007年底宣告关闭。
我曾经花了很长时间研究计算机股票和互联网股票,我们知道,网络上传输音视频等多媒体信息主要有下载和流式传输两种方案。对于多媒体信息传输原理我在这篇文章中重点讲述两个方面,第一个方面是信息采集技术,第二个方面是信息压缩技术。
通俗的说,现代的通信技术就是将消息转换为能够远距离传输的电信号或光信号,到了1948年数学家香农发表了一篇题为《通信的数学理论》的学术论文,这篇划时代论文的问世,宣告了信息论的诞生。按信号的特征,通信中的信号,基本上是时间的函数。我们可以以正弦信号为例由简单的信号来了解一下信号的特征。正弦信号一般是用三角余弦函数来表示,x(t)=Acos(w0t+f)。其中A表示最大振幅,也就是钟摆最大的摆动幅度:w0为角速度,表示为w0=2p/T,T是这个信号的周期,两个波峰的间隔即为一个周期。因为周期和频率是反比关系,周期的倒数等于频率f0,所以w0也可表示为w0=2pf0,这就把与频率等同起来了,所以以后再见到w,要想到这是信号的频率f0。(w0t+f)称为信号的相位,f称为信号的初始相位,也就是在初始时刻的相位。
事实上,无线通信中调制用的载波就是正弦波。正弦波是可以由电路来产生的,产生正弦波的电路也称为正弦波振荡器。在信息传输中,调制阶段会选用正弦波振荡器,通过电路产生正弦波的电磁波,再将模拟信号或数字信号加入到正弦波上,以向外传输信号。
Mysee当时的业务红火主要是因为多媒体信息数据传输对流量要求极高,假设传统的文本数据用编码来表示的话,数据量并不大,但多媒体信多本道信息的数据量庞大。有一次我从网上下载了一张图片存储量要0.3MB,我计算了一下,这张图片的分辨率是640像素×480像素(640像素×480像素 = 307200 bit = 0.3 Million B),到了网上下载一首歌曲,CD质量双声道的声音,每秒存储量需要1.4MB之多。这就意味着,如果要听CD,高质量的声音,每秒的下载存储量要达到140万bit。
多媒体信息如此高的传输要求就导致了流式传输的普及,所谓流式传输主要就是指将整个音频和视频及三维媒体等多媒体文件经过特定的压缩方式解析成一个个压缩包,由视频服务器向用户计算机顺序或实时传送。通过这种方式,流式传输是多媒体文件传输过程中压缩成一个个压缩包连续传递给收件人,收件人解压缩可以观看到视频。
流媒体的播放方式是让部分内容存入内存,在计算机中对数据包进行缓存,这就使得系统缓存的压力减少了。需要说明的是,实现这种流式传输一般都需要专用的服务器和播放器,例如Apple公司的QuickTime。而且流式传输的实现需要合适的传输协议。这里我们不得不提一下,由于TCP需要较多的开销,所以它是不太适合传输实时数据的。在流式传输的实现方案中,我们一般采用HTTP/TCP来传输控制信息,而采用实时传输协议/用户数据报协议(RTP/UDP)来传输实时数据。
流媒体技术的一个优点是,即使有很多数据包时,也并不需要大容量的缓存。这是因为在流式传输中,由于高速缓存会不断丢弃已经播放过的内容,利用空出的空间来缓存后续尚未播放的内容,所以流式传输所需的内存缓存量并不大。而有了缓存就可以降低时延和抖动的影响,因为一个实时音视频源或存储的音视频文件在传输过程中将被分解为许多数据包,而网络又是动态变化的,各个数据包选择的路由可能不相同,因此到达客户端的时延也就不同,甚至先发的数据包有可能后到。使用缓存系统后,这些数据包都将先入到缓存中,然后再根据数据包顺序正确发送,从而使媒体数据能够连续输出。视频直播中,很容易出现延迟现象,抖动是基于延迟性的,具体来说,它是延迟时间忽短忽长的表现形式,抖动是两个数据包之间延迟时间的差异。
假设F(t)为原始信号,有两种对该信号的抽样方式,第一种是瞬时抽样,即每间隔TS对F(t)抽样一次,如果时间间距足够小则得到清晰的原始信号。另一种是采用F(w)的低通抽样方式,后一种最为常用的,因为可以节省空间。
让我们思考一下,采样电路的实现是通过乘法器,将输入信号和采样信号进行相乘。假设x(t)是普通的信号,p(t)是周期的冲激串,是理想的采样信号。它们的波形如左下图所示。显然,这两个信号相乘时,只在冲激发生的这些点上才有输出值,因为冲激强度为1,这就相当于在冲激发生点上把信号x(t)的样本值采出来了。我们知道,时域中两个信号相乘,频域中是要卷积的。借助调制的卷积经验,可以直接将输入信号的频谱搬到采样信号的频谱上,就得到了卷积后的频谱,也就是输出信号的频谱了,如下图中间那张图所示。
根据奈奎斯特抽样定理,我们都知道,如果采样频率过小,已采样信号的频谱就会有重叠,如果要完全恢复出被采样的信号,那么已采样信号的频谱里应存在完整的被采样信号的频谱。那么如何得到完整的被采样信号的频谱呢?采样频率是指假设一个输入信号最低的时间周期为10秒,即这个信号最快也要10秒才能重复一次。采样频率就必须大于被采样信号的最高频率2倍,这样的话,采样频率必须5秒以内就要进行一次,由此可以得到一个结论:采样频率必须大于被采样信号最高频率的两倍,才不会发生频谱重叠,或者说不影响被采样信号频谱的完整性。即采样频率必须要大于被采样信号的最高频率的两倍,这也是低通信号的采样定理。
通过这种方法,我们选取了适合的将原始信号进行抽样的信号形态,即它的最小频率要高于2fH。低通抽样信号F(w)乘以原始模拟信号F(t)将会获得被处理后的数字信号Y(t),在通过一个截止频率为wH的理想低通滤波器将Y(t)中的第一个F(w)滤出来,以恢复出原始信号F(t)。这种情况下,滤波器可以提取出一个干净的F(w),将F(w)进行排列和处理就可还原原本的F(t)。
在抽样定理中,可以通过低通抽样获得原始信号的一个周期值,进而还原出一个原始信号。但因为低通抽样下获得的原始信息样本中,原始信息样本内有因时间间隔造成的空隙,为了压缩空隙,保证频带的宝贵资源不被占用,又进行了带通信息的处理。其中fH为信号最高频率,fL为最低频率。
这里,假设在60s时间里,一个人每隔10s会说一段“ABCDE”的话,这句话时长为2s,则根据奈奎斯特抽样定理,抽样频率要大于信号中频率的2倍,此处原是信号频率为6,时间间隔为10s,则根据奈奎斯特抽样定理,要获得完整信号“ABCDE”,抽样间隔须小于5s。这就是带通信号的内涵,它能节省频率的空间。
我们再介绍流媒体的第二方面,即信息压缩技术。在流媒体技术中,如果想要尽快的传输信息,那么就需要对信息进行压缩。这是因为,数据量=信息量+数据冗余,数据量是数据采集时提供的,信息量是我们从采集的数据中获取的有用信息,数据冗余就是多余的数据。这就像古代帝王的宫廷乐师队伍,既有技艺高超如高渐离者,也有滥竽充数的南郭先生之流。这高渐离就是信息,南郭先生便是冗余了。
信息可以简单理解为数据中包含的有用的内容。通过算法我们可以去除冗余,举一个简单的例子,比如从1到64中确定一个数,我在手上写这数,你们猜出这个数来。那么如何最少的次数猜到这个数字呢?可以问“这个数是不是大于32?”就一下子去掉了一半的可能性,如此这般,只要6次(32,16,8,4,2,1)通过六次计算就可以猜中,优秀算法可以减少信息冗余,从而提高信息传输速度。
在通信信息传输过程中,文字、声音、图像等信号都存在冗余,具有很大的压缩空间。并且冗余量减少可以只减少数据量,而不减少信源的信息量。既然我们知道,信息量是由有效信息和冗余信息构成,要使得数据传输足够快,就要压缩冗余信息。那么接下来我们就要讲三个压缩冗余信息的方法。
第一种方式是空间冗余,在分辨率相同的情况下,两张图片所包含的像素应该是相同的。同一景物表面上采样点的颜色之间往往存在着空间连贯性,而基于离散像素采样来表示物体颜色的方式通常没有利用这种连贯性。例如,图像中有一片连续的区域,这个区域的像素都是相同的颜色,那么空间冗余就产生了。如上面的第一张图,可以看出图片的背景所有的像素点完全是相同的颜色,如果按照像素采样的话就存在大量的空间冗余信息。(上面的两张图中,左图是一张空间连贯性的图片,右图是一张空间离散型的图片,这是因为右图中有一片连续的区域的像素都是相同的颜色,那么空间冗余就产生了。)
第二种方式是结构冗余,结构冗余是在某些场景中,存在着明显的图像分布模式,这种分布模式称作结构,例如方格状的地板、蜂窝、砖墙、草席等图就在结构上存在冗余。图像中出现的重复或相近的纹理结构,可以通过特定的过程来生成。只要知道了图像结构的分布模式,就可以通过某一过程生成图像,而不需要传输,这样就避免了结构冗余。结构冗余是指图像中出现了重复或相近的纹理结构,例如电视中的雪花图案,是高度重复的。因此,只需要传递较小的数据量即可。
第三种方式是时间冗余,假如要传输下面这样连续的4幅图像,我们可以看出图像在不同时间点的变化并不大。假如我们要将这4幅图像依次从A端传输到B端,如果每次都传输完整的图像象,我们体通信现有很多信息是完全相同的,这相同的信息就是时间余信息。相同的信息应该就是这个人的全身。这正是我们传输4幅图像时会重复传输的冗余信息,通常对于时间冗余信息采用关键帧技术来处理。
关键帧就是一帧参考图像,每隔一定时间抽取一次,在通信过程中,只传输关键顿的完整信息,两幅关键帧之间的帧我们只传输它跟关键帧不一样的地方。假如抽取第一幅图像作为关键帧,那么传输第二幅图像时,可以只传输这幅图像和关键帧之间的不同之处,这个只传输每一帧跟关键帧之间差异的帧称为差值帧,在接收端用收到的第一帧关键帧和差值帧合成第二帧;传输第三幅图像时,也取该帧和关键顿之间的差值帧,在接收端用此差值帧和关键帧合成第三帧,依此类推。通常来说在这个技术上,关键帧的选取通常为每隔3帧选取一个,差值帧每一帧都会选取一个。如果关键帧间隔越大,则可以节约带宽资源,但如果中途出现了差值帧或关键帧的缺失,会导致图像失真。因此,通常关键帧是每隔3取1。
在传输视频信息,关键帧的间隔越长,压缩比就越大,但是信号还原出的质量也越差,这就是我们的图像压缩比过大会失真的原因。另一方面,从压缩技术看,一般压缩的计算量比解压缩要大。压缩分为对称压缩和非对称压缩。压缩和解压都需要实时进行称为对称压缩,如视频会议的图像传输;压缩可以用非实时压缩,而只要解压缩是实时的,这种压缩称为非对称压缩。事实上,对于静止图像,压缩速度没有解压缩速度要求严格:但对于动态视频的压缩和解压缩,速度问题是至关重要的。优酷网络一个很大的优势就在于它对于动态视频压缩和解压的能力很强,所以,优酷观看画面流畅。
第二部分、视频行为识别的科学原理
我看过海康威视、大华股份等一些监控视频与智慧城市类型的A股上市公司资料。我们知道,人在生活中判断一个人的行为是根据不同的运动过程。既然区分不同行为动作的重要依据是运动,那么应该如何提取视频中的运动信息呢?对于我们人类来说,识别出目标在三维空间中的运动很简单。但是在计算机看来,视频只是一帧帧图片的序列。它并不知道这些图像中的人在哪,更无从知道这些目标做出了怎样的运动。这就需要我们设计一种算法,让计算机能够从序列化的图像中得到人体的运动特征。
视频行为识别是通过帧进行的,帧是指影像动画中最小单位的单幅影像画面。通俗地说,一幅图像就是一帧。图像所包含的信息用像素来度量,就像细胞是组成人体的最小单元一样,像素是组成一幅图像的最小单元。一个像素点由红(R)、绿(G)、蓝(B)三基色组成,对每一基色的深浅程度用灰度级表示,称为色彩精度。通常在图像处理时取每色8位,即每色=256种。一个像素点由三基色组成,即一个像素点可以用××=比特,即24位表示,这样的像素点被称为24位真彩色。这样一来,每一个像素由红、绿、蓝三基色组成,每一基色例如红色,有28=256种红,则一个由红、绿、蓝三基色组成的像素点可以显现出224种颜色。
从物理知识中我们知道,在现实世界的三维空间中,可以用位移、速度等物理量来描述空间中一个点从一个位置经过一段时间到达另一个位置的运动过程。在视频处理中,我们用光流(optical flow)来描述运动的情况。确切地说,光流描述的是三维的运动点投影(project)到二维图像之后相应的投影点的运动。由于我们处理的是运动被拍摄后的二维图像数据,所以只能用二维投影点的运动来间接地刻画真实世界中的三维运动。
为了理解光流是什么,我们以二维平面中运动的点投影到一维直线上的情况作为例子。如下图所示,t时刻一个点位于二维平面中的Pt处,经过相机的拍摄,会在一维直线l上得到它的投影点P't。经过时间△t,它运动到了Pt+△t点,在直线上的投影点就移动到了P’t+△t点。向量P'tP’t+△t描述了点的投影点在直线l上的运动过程,也就近似地描述了点在真实的二维平面中的运动状态。当时间间隔△t足够小时,向量P'tP’t+△t就可以看成投影点的瞬时位移(displacement),也就是我们所说的光流。
我们看看视频中的光流怎么计算。下图中是视频的相邻两帧I(x,y,t)和I(x,y,t+1),由于光流就是同一个点在相邻两帧的位移,所以计算光流的关键是把两帧之间的相同的点对应起来。为了能够找出相互对应的点,我们需要两个关键的假设:(1)相邻两帧的物体运动比较小;(2)相邻两帧的颜色基本不变。有了这两个假设我们就知道图像中的像素点从t时刻运动到t+1时刻后它的位置、颜色和亮度变化不会很大。也就是说,对于第t帧I(x,y,t)中的像素点P=(x1,y1),我们只需要在第t+1帧I(x,y,t+1)中的对应位置周围寻找和像素P颜色一致的像素点P’=(x2,y2),将P看作P运动后到达的位置。这样得到对应的点后,就可以计算出第t帧中点P处的光流w:(u,v)=(x2,y2)-(x1,y1)。当我们计算光流时,将每个点的光流向量用箭头表示。箭头的方向就是该像素点的运动方向,箭头的大小就是像素点运动的位移大小。从光流图上可以看到物体运动的方向。
为了进行视频行为识别,我们会通过光流直方图(Histograms of Optical Flow)对图像中的物体进行区分,从而表示出视频中物体的运动信息。首先,我们把起始时刻记为t,在t时刻的视频帧中选取一个点,将其位置记为P=(x,y)。在t时刻到t+L时刻的每一张视频帧中,我们均以点(x,y)为中心截取大小为NxN的区域。这样就得到了由L张同样大小的局部区域图像组成的时空体 (space-time volume)。
例如从t时刻到t+L时刻中视频共有4帧,则帧与帧之间形成了3个时空单元,可以将这三个时空单元进一步分割,每个时空单元被切成4个小块。这样4帧图的视频组就构成了12个时空单元。在建帧时,我们假设在t时刻从初始帧中选择一个点P(x,y),以点P为中心截取N×N的区域。
然后,我们对这个时空体进一步分割:在每一张图像上用2×2的网格将其划分为4个更小的区域,在时间维度上,我们把它分割成3个相等的部分。于是,我们就可以得到如下图所示的12(2×2×3)个时空单元(space-temporal cell)。
在平面坐标系中,已知A(a1,b1),B(a2,b2),则AB两点间的距离为
,
已知空间直角坐标系中,已知A(a1,b1,c1),B(a2,b2,c2)则AB两点间的距离
接着,在每个单元内部,我们对每个像素位置处的光流进行统计。假定图像中某一像素点(x,y)处的光流为w(x,y)=(u,v),这是一个二维的向量,其中u,v分别表示x轴和y轴方向的光流分量。由此可得像素点(x,y)处的光流大小为:
这里指的光流是指从平面的角度看原来的Pt(x,y)移动的距离。像素点(x,y)处的光流方向为:
一个行为的发生,从开始到结束往往会延续较长的时间。我们注意到光流只描述了相邻两帧之间目标的运动,而光流直方图对时间的分割又比较粗糙。这些方式在描述运动的时间维度信息时有比较大的局限性,要更准确地刻画长时间的运动,我们就要结合连续多帧的信息。为了获得描述一段时间内物体运动状态的轨迹特征,就引出了从光流到密集轨迹的概念。
如下图所示,设第t帧图像中某个点的坐标为P=(x,y),运用光流信息我们就可以逐步计算出这个点在下一帧中的位置。从最初的视频帧中选一个点Pt=(Xt,Yt),这里Pt是一个点,从第一帧运行到第二帧,Pt=(Xt,Yt)移动到Pt+1=(Xt+1,Yt+1)。这里得到向量
DPt=Pt+1 - Pt =(Xt+1,Yt+1)-(Xt,Yt),DPt表示由Pt起始点运动到终Pt+1的两个点构成的向量。
比较向量之间的关系只能用向量夹角来表示,而不能由距离表示,我们所计算的空间中两点A(a1,b1),B(a2,b2)之间的距离为
计算向量之间的夹角一般用如下余弦定理来计算。
这里我们讲一下空间向量的概念,我们知道,用一系列位移量可以描述一个动作过程。所以,我们可以运用公式△Pt=Pt+1-Pt=(xt+1-xt,yt+1-yt)依次计算出特征点P在L帧中每一次的位移量,进而得到向量(△pt,…, △Pt+L-1)。我们把这个长度为2×L维的向量称为轨迹( trajectory ),即
,
用它来描述一段时间(即L帧)内特征点P的运动过程,这样就完成了从光流到密集轨迹概念的数学刻画。
我们知道,光流w:(u,v)=(x2,y2)-(x1,y1)在每个像素有两个分量,分别代表水平和垂直方向的位移。如果我们把所有的水平位移取出来,然后再把它们的值缩放到0到255之间,那么就得到了一张灰度图像,叫作水平方向上的光流灰度图。同理可以得到垂直方向上的光流灰度图。水平和垂直光流灰度图,可以作为卷积神经网络的输入,提取视频中的运动特征。
这个地方我想过很长时间的原理,一张1000×1000分辨率的图片包括了100万像素点,光流在每个像素点有2个分量,分别代表水平方向位移和垂直方向位移。如果将100万个像素的水平位移取出来,再将他们的值缩放到0-255之间,就得到了一张灰度图像,称为水平方向上的光流灰度图,同理可以得到垂直方向上的灰度图。我们需要注意的是,在实际运用中,如果原先像素点出现了较大水平或垂直位移,则缩放时,将接近255,而静止不动的像素点数值接近于0,这就使我们在一张黑白相片中发现明亮的部分发生了较多移动,通过将水平方向与垂直方向的光流灰度图输入卷积神经网络,就可以提取到视频中的运动特征。
在具体的视频行为识别过程中,我们可以将视频的信息分成静态和动态两个方面,静态信息指图像中物体的外观,其中包含相关场景和物体,这可以通过静态图片帧获得。动态信息指视频序列中物体的运动信息,包含观察者和物体的运动,可以通过光流灰度图来获得。视频行为识别中广泛运用的双流卷积神经网络技术(two-stream CNN)就利用两个不同的网络来实现同时处理静态和动态信息。我们具体讲一下双流卷积的含意,我们把以随机抽取的单个彩色图像帧作为输入的网络称为空间流卷积神经网络( spatial stream CNN),而把多帧(比如10帧)的光流图像作为输入的网络称为时间流卷积神经网络( temporal stream CNN)。由于双流卷积神经网络用的是两个独立的卷积神经网络,所以在我们得到两个流对各行为的得分后,需要采用按类别取平均或者取最大的方法,对两个流的行为得分进行融合。
我仔细考虑过,在双流识别框架中,时间流卷积神经网络是从输入的光流图中提取特征。前面也讲过光流直方图特征,两者都是从光流中提取特征,那么它们在方法上有什么区别吗?事实上,光流直方图是对光流方向进行加权统计,得到光流方向信息直方图,属于手工设计的特征。而在双流识别框架中,是将光流分解为水平和垂直光流图,然后送入卷积神经网络提取出运动特征。这是让计算机自动地学习出光流图中的运动信息。与手工设计的光流直方图相比,卷积神经网络具有更高效的特征表达能力,通过网络逐级提取从底层像素到高层语义的特征,从而更有效地进行行为识别。因此双流卷积神经网络的视频行为识别技术要运用光流直方图刻画物体运动轨迹特征要更准确。
值得注意的是,这里光流图中对于帧的堆叠是为了捕捉时序相邻帧之间的运动信息,如果输入的帧数太少,会造成时序信息捕捉不完全,无法代表较长的视频序列。如果输入的帧数太多,又会造成计算量的增加。那么输入多少帧合适呢?实践经验表明,当光流图帧数选取到一定值后,帧数对识别的精读影响不大,所以可以选用次临界值,它平衡了对精度和速度的要求。
我曾经查阅过资料,在实践应用中,对于短视频(10秒左右),双流神经网络可以很好地进行识别。对于长视频的识别,它给我们带来的挑战是如何对较长的时间进行建模。为了能够处理长视频,我们又有了时序分段网络的概念,它可以处理长视频数据(几分钟)的神经网络。事实上,时序分段网络(temporal segment networks, TSN)就是为了解决视频中存在跨越时间长的行为被提出的。
我们最终得出结论,在人工智能视频识别时,会将视频的信息分开静态和动态两个方面,视频识别中,主要应用双流卷积神经网络(tow-stream CNN),运用单个彩色图像帧获得绝大部分静态信息,将其输入空间流卷积神经网络(spatial stream CNN),将动态帧的光流图像输入至时间流卷积神经网络(temporal stream CNN)。在视频行为识别中,运用的双流卷积神经网络用的是两个独立的卷积神经网络(空间流卷积神经网络处理有彩色图片,而时间流卷积神经网络处理灰度图),因此,在将视频通过空间流与时间流卷积神经网络进行处理后,还需要进行融合,这个过程如果时间逐渐叠加,就会形成时间分段网络,从而使得时间分段网络能够模拟整个较长时间的结构,模型也能够动态覆盖整个视频。
第五部分:人工智能与VR产业链公司
先讲一下电子政务相关的公司, 数字政通(营业收入12.03亿、净利润1.70亿、加权平均资产报酬率9.87%、研发投入0.90亿、毛利率35.15%),数字政通是一家从事软件研发和销售的企业,公司主要从事基于电子政务和GIS应用平台的开发和推广工作,为政府部门提供GIS、MIS、OA一体化的电子政务解决方案,并提供政府各个部门间基于数据共享的协同工作平台.公司是国内为数不多的专注于数字化城市管理和国土资源管理领域的专业电子政务解决方案提供商之一,并在数字化城市管理和国土资源管理领域占有了相当比例的市场份额。
该公司主要是做技术软件的,为政府部门提供服务,客户黏性好,开辟了新的数字化城市管理应用领域,是基于城市电子政务专网,无线通讯 网,运用空间网格技术,地理编码技术等,以数字城市技术和数字化城市管理新模式业务为依托建设而成的综合信息系统。近年来的情况是数字政通中标福建省宁德市网格化服务管理信息平台和宁德市政务云计算中心PPP 项目,总中标金额9093万元。公司控股子公司金迪管线报告期内中标福州市“四城区排水管网(雨、污水)排查”项目,项目金额2439.65 万元。
我的看法是数字政通是一家云计算SaaS的软件服务商,它的主营业务产品是软件开发(毛利率为52.3%),这里我们要指出,如果一家软件企业的主营业务是系统集成,通常它的毛利率在10%-15%之间,例如数字政通的系统集成业务为13.33%,主营业务为软件开发的上市公司其技术水平更专业,数字政通近三年来加权净资产收益率稳定在10%,我的看法是将其列入股票(观察)池中,但不列入股票池中,这是因为数字政通的业绩更多依赖于政府PPP项目建设,在基建向下走国家去杠杆的趋势下,数字政通的业绩难以向上走,但它是政府数字政务的优秀平台标的。
另一家做电子政务的公司是南威软件(营业收入 8.07亿、净利润 1.03亿、加权平均资产报酬率11.01%、毛利率33.33%),公司的主营业务是电子政务云平台与平安城市产品,核心产品包括电子证照解决方案、网上办事大厅、行政权力运行系统、社区网络化系统等。南威软件位于福建泉州,85%以上的业务仍在华南,并且不对福建以外的省市开设平安城市,预计随着18年“数字福建”的落地,公司将大幅受益。我的看法是由于南威软件是一家福建当地企业,过去三年来的加权净资产收益率不到10%,它的业务高度依赖福建PPP项目的建设,如果要投资优秀的Paas政务云平台软件开发提供商,我认为应选择技术实力更强,且布局为全国性的上市公司,很明显数字政通比南威软件是更好的投资标的,我的看法是南威软件不列入股票池中,而将数字政通列入股票(观察)池中。
在智慧城市领域中,佳都科技(营业总收入43.12亿、净利润2.16亿、加权平均资产报酬率6.95%、研发投入1.44亿、毛利率13.63%),公司是以提供智能安防和智能轨道交通业务和服务为核心发展方向。在此基础之上,公司将积极探索云计算、大数据在行业的深度应用,探索智能算法技术和云平台技术等在更广阔领域的应用,以互联网思维探索向“互联网+泛安全”和“互联网+城市交通”等领域的相关业务延伸。
佳都科技主要有两块业务,第一块业务是智能轨道交通业务,公司主要面向地铁、城际轨道、有轨电车、BRT 快速公交等细分市场, 提供自动售检票系统(含移动支付子系统)、站台屏蔽门系统、综合监控系统和通信系统(含视频监控子系统)四大智能化系统解决方案,目前业务已累计覆盖广州、武汉、青岛、宁波、厦门等18 座城市。
第二块业务是智慧城市业务,该业务面向公共安全、智能交通等智慧城市细分领域,提供从顶层规划设计到垂直行业的可视化解决方案,如视频监控联网平台、视频监控运维管理平台、警务视频云平台、公安实战平台、电子警察、卡口系统、道路监控系统、社区网格化综治平台等系列产品。业务累计覆盖广东、新疆、山东、贵州等区域。
公司的核心产品是在2018年广州国际智能安全科技应用博览会上发布首款商用人脸识别终端一体机,人脸识别终端一体机已经实现量产,在公安、交通、能源等领域的项目中开始产品交付。同时,公司参股人脸识别独角兽“云从科技”。佳都科技作为最正宗的人工智能行业的独角兽“云从科技”最初的投资者,占比约10%,提供题材炒作的可能。云从科技是国内四大AI独角兽之一,估值约220亿元,主要提供以人脸识别为基础的,面向金融、安防、交通领域的行业解决方案,目前,云从科技已成为中国银行业第一大AI供应商。我的看法是,应当将佳都科技列入股票池中,这是因为它在智能轨道交通业务和智慧城市业务中具备非常强的人脸识别、车辆特征识别、视频大数据等技术,虽然它最近三年加权净资产收益率不到10%,但它所处的行业营业收入增长速度很快,因此,我选择将佳都科技列入股票池中。
东软集团(营业总收入71.31亿、净利润8.90亿、加权平均资产报酬率11.87%、研发投入9.59亿、毛利率31.63%),东软的主要业务有两块,第一块是智慧城市与传统软件领域(毛利率为30.12%)、第二块是智能汽车互联领域(毛利率是22.76%),第三块是医疗健康及社会保障领域(毛利率是38.28%)。在传统的软件领域,经历了软件、PC互联网、移动互联网几轮大浪潮下来,软件行业早就不复90年代的辉煌了,东软做的一直是软件外包业务,毛利率每年在20%-30%之间上下沉浮,公司整体净利率更是多年在10%以下趴着。IT老大哥听上去高大上,其实也就是个劳动密集型公司,收入多少拼的是程序员人头。
第二块在智能汽车领域里,在全球前30大汽车品牌中,85%都使用了东软的车载信息系统,奔驰、宝马、大众、本田、丰田、宾利、法拉利,还有绝大部分国产车厂都是东软的客户。同时,东软对价收购ISG所拥有的与汽车导航系统相关的电子硬件、机械硬件和应用软件开发业务订单和将近200人的研发团队。
东软集团是一家软件开发能力较强的公司,这使得它有能力转型做云计算产业链中SaaS app软件开发服务商,它向智能汽车互联、医疗健康、智慧城市的转型,是为了进入更高云计算产业链PaaS云平台的尝试,我的看法是,应当将东软集团列入股票池中,它是一家优秀的PaaS软件平台技术服务支持提供商。
易华录(营业总收入29.93亿、净利润2.74亿、加权平均资产报酬率7.43%、研发投入2.23亿、毛利率28.53%),易华录的主营业务是做数据湖,所谓数据湖是指加了光存储的数据中心,通过自己的大股东华录集团的央企背景去卖给政府。简而言之,它的商业模式就是向政府兜售数据中心。
我们要说明一下,数据库和数据仓库,存储的是结构化的数据,是经过加工处理的,这种数据便于访问,响应及时。而数据湖可以存放各种类型的数据,结构化的和非结构化的任意数据。可以磁盘可以光盘存储,存储成本更低,在存放数据时不受制约,也可能具有安全隐患。数据湖基础设施建成之后,会通过各种渠道采集数据,包括政府采集的城市公共服务数据。然后系统的云计算模块对其进行大数据分析,形成有用的价值判断并提供给付费用户使用。易华录的这个光磁融合存储技术,本质上就是云计算IaaS基础设施建设使用的。我的看法是易华录的技术较有优势,可以广泛使用在云计算IaaS基础设施建设上,但是易华录是一家央企,过去三年来加权净资产收益率没有超过10%,因此股东难以分享投资收益,我的看法是将易华录放入股票(观察)池中,以后也不放入股票池中。
在网络信息安全方向中,我们先看一下蓝盾股份,蓝盾股份(营业收入22.16亿、净利润4.14亿、加权平均资产报酬率10.96%、研发投入2.45亿、毛利率54.48%),蓝盾股份主营信息安全产品及信息安全集成、一直专注于网络信息安全领域,2015年起,蓝盾股份开始通过外延并购扩充业绩,公司先后收购广州华炜科技股份有限公司、中经汇通电子商务有限公司、汇通宝支付有限责任公司以及深圳市满泰科技发展有限公司,累计耗资20.72亿元。蓝盾股份的问题是由于外延并购过多,蓝盾股份的应收账款占营收比例很高,这使得每年的应收账款计提坏账损失很大,自上市以来,蓝盾股份的财务情况非常紧张,公司尝试了包括定向增发、公司债、可转债在内的多种方式进行融资。
我的看法是尽管蓝盾股份过去三年来加权净资产收益率维持在10%以上,且其主营业务产品安全及安防集成毛利率为41.53%,但是我们通常不会在股票池中选择外延并购较多的公司,因为外延并购会使得公司主营业务不单一,并且使得业绩难以预测,同时公司客户分散在多个领域,而对于网络安全类软件公司来说,应当尽量精通某一个行业或者拥有核心大客户,蓝盾股份都未能做到这一点,因此我选择不将蓝盾股份列入股票池中。
中新赛克(营业收入4.98亿、净利润 1.32亿、加权平均资产报酬率20.09%、毛利率79.03%),中新赛克前身是中兴通讯子公司中兴特种,刚成立时中兴通讯持有公司54%的股份,后来全部退出来了,但目前中兴通讯始终是中新赛克第一大供应商。因此中新赛克的技术底蕴是非常好。中新赛克主要业务属于网络可视化基础设施层,同时公司布局大数据运营产品以及网络内容安全产品。
DPI可以对数据流量进行深度分析,政府、运营商、企业是主要需求来源。DPI实现的功能主要有:1)应用分析,网络流量构成分析、性能分析、流向分析等;2)用户分析,用户群区分、行为分析、终端分析、趋势分析等;3)网元分析,根据区域属性(市、区、街道等)、基站负载情况进行分析等;4)流量管控,P2P限速、保证QoS、带宽保障、网络资源优化等;5)安全保障,DDoS攻击、数据广播风暴、防范恶意病毒攻击等。可以看到上述功能对应的需求主要来自于政府、运营商以及大型企业等。
网络可视化行业类似于数据空间的“岗哨”,对网络数据进行采集,并将有用信息进行可视化处理后传递给最终用户。网络可视化的流程:1)将数据采集设备通过物理线路或天线接入到实际网络中,获取当前网络传输的所有信息,然后根据相应接口标准,移交相关数据至相应储存设备或数据库。2)通过服务器或分析处理软件对储存数据进行分析处理,提取有用信息加以详细研究和概括总结,用图形形式展示,帮助用户进行可视化分析,满足用户的业务需求。通常我们将采集设备称为网络可视化产业的“前端”,而将数据存储、分析与处理称为“后端”。我的看法是中新赛克在网络可视化的领域中的技术是非常占优势的,这是一家优秀的网络安全投资标的,我选择将中新赛克列入股票池中。
在大数据分支方面,拓尔思(营业收入8.21亿、净利润1.58亿、加权平均资产报酬率9.18%、研发投入1.45亿、毛利率62.55%),拓尔思主要做NLP 技术,它是一种使机器理解人类语言的AI 技术,其应用场景广泛,包括搜索引擎、智能客服、商业智能(如网络营销)和语音助手等,国内则主要致力于联合BAT平台进行技术的应用。
公司全线产品几乎都有NLP 技术沉淀,如sever/Hybase、CKM、雷达、舆情等。NLP 技术在公司早期产品的形态是企业级搜索,行业拓展涉及新闻、专利、安全、金融、政务等行业。简单的说,拓尔思是一个AI投资标的,它对标的是语音智能龙头科大讯飞,从营业收入来看,2017年科大讯飞营业总收入为54.5亿,净利润为4.3亿,研发支出为11.4亿,而拓尔思2017年营业总收入为8.21亿,净利润为1.58亿,研发支出为1.45亿,相比于科大讯飞,拓尔思没有核心产品,对于人工智能领域,中国公司的技术优势不在于创造而在于应用,因此,在中国,应用平台BAT是比芯片类公司更有投资价值的标的,并且拓尔思习惯于每隔三年进行一次大收购,这使得拓尔思的业绩难以预测,公司近三年来加权净资产收益率连续低于10%,我的看法是,不将拓尔思列入股票池中。
天源迪科(营业收入29.63亿、净利润1.56亿、加权平均资产报酬率6.49%、研发投入2.37亿、毛利率19.56%),深圳天源迪科信息技术股份有限公司是一家专注于电信、金融、公安等行业应用软件产品的研发和销售,为电信和政府等行业提供解决方案、产品和服务的云计算PaaS云服务平台公司。公司作为电信业务支撑系统的主流供应商,为中国电信、中国联通提供一流的产品和服务,是中国电信和中国联通IT支撑系统领域核心合作伙伴之一,产品包括电信数据仓库类软件、实时在线计费类软件、客户关系管理类软件、准实时计费账务类软件等。
另一方面,天源迪科 1993 年起即涉足公安行业,在出入境管理、交通管理、情报线索分析领域经验丰富。立足公安业务基础与大数据能力,公司合作华为、腾讯云推出警务云大数据平台,通过大数据技术分析处理以发现潜在线索, 在公安网内以 SaaS 方式向民警提供服务。目前警务云已上线深圳、珠海公安局等。我的看法是由于它的主要客户来自电信、金融和公安行业,天源迪科产品集中度高,技术门槛好,与中国电信、中国联通、阿里云、腾讯和华为在大数据上建立了深度合作,虽然过去三年来加权净资产收益率没有超过10%,但仍应当列入股票池中,它可能是最好的一家大数据类公司投资标的。
博彦科技(营业收入22.50亿、净利润2.18亿、加权平均资产报酬率10.95%、研发投入1.35亿、毛利率29.05%),这家公司最早是做软件外包业务的。所谓软件外包就是一些发达国家的软件公司将他们的一些非核心的软件项目通过外包的形式交给人力资源成本相对较低的国家的公司开发,以达到降低软件开发成本的目的。众所周知,软件开发的成本中70%是人力资源成本,所以,降低人力资源成本将有效地降低软件开发的成本,比如港股的中国软件国际就接了很多华为的活。博彦科技主要做云计算与大数据方面的业务。
在云计算方面,博彦科技通过软件外包的技术积累,开始向云计算中的PaaS平台服务商转型,以通讯连锁零售企业为例,可以通过大数据平台,统一了集团内部的数据标准和数据逻辑,打通用户在全渠道的数据,建立用户全景影像,并利用用户画像数据做到了有针对性的营销推广。目前博彦科技以知名公有云(微软、亚马逊、腾讯、阿里)及私有云为底层平台基础,能够提供云计算、物联网、大数据、人工智能产品相关的解决方案及服务,帮助企业快速实现云化,完成数字化转型。
在大数据业务方面,博彦科技通过主流的网站分析技术,为客户提供互联网消费者行为研究、行业竞争分析咨询以及媒体信息监测等服务;为企业提供24小时无间断的优质网站分析服务,通过实施严格的数据保护措施和网站数据运营服务来保证企业客户数据的准确性,为搜索、电子商务、社交网络、商旅、视频等网站提供高附加值的分析服务。假设用淘宝搜索一些东西之后你会发现你下次打开淘宝,它会根据你以往的搜索记录给你定向推荐一些商品,博彦科技具备这一大数据技术,同时,博彦科技也有区块链技术储备的。
我的看法是,博彦科技是一家优秀的大数据投资标的,它的营收状况与天源迪科相仿且净利润高于天源迪科,财务数据上过去三年来博彦科技的加权净资产收益率也由于天源迪科,博彦科技的问题在于它的金融业务中区块链技术还没有体现出利润的增长点,我选择将博彦科技列入股票池中,在我看来,天源迪科与博彦科技都是优秀的大数据投资标的,但天源迪科是更好的投资标的,主要在于,天源迪科的主营业务在电信、金融、公安系统,它的业绩更稳定,而博彦科技的相对优势在金融板块的区块链技术,由于区块链技术还未到成熟阶段,所以目前来看天源迪科是比博彦科技更好的投资标的。
在汽车电子领域中,德赛西威(营业总收入60.10亿、净利润6.16亿、加权平均资产报酬率41.37%、研发投入4.18亿、毛利率25.78%),德赛西威聚焦的内饰汽车电子,内饰汽车电子就是中控、空调、仪表、显示屏。目前,德赛西威的核心产品主要有车载信息娱乐系统,车载空调控制、驾驶信息显示系统等,其主要产品的市场需求取决于新车的销量和单车配置的提升。
目前,德赛西威已进入众多知名汽车制造商的全球零部件供应体系,国内主要客户为一汽大众、长城汽车、广汽集团、通用五菱、上汽通用、上汽大众等;国外客户为马自达、大众集团、卡特彼勒、蒂森克虏伯等。与德赛西威业务相近在汽车电子市场互相竞争的还有华阳集团、索菱股份和路畅科技三家上市公司。德赛西威在盈利能力和营运能力上均更占优,是汽车电子最好的投资标的之一。我的看法是,德赛西威的主营业务产品汽车信息娱乐系统目前国内面临汽车销量放缓,国外面临贸易战外销困难,因此该行业非常低迷,我选择将德赛西威列入股票(观察)池中,以后也不列入股票池中。
我们继续谈一下华阳集团(营业总收入41.66亿、净利润2.79亿、加权平均资产报酬率8.01%、研发投入2.96亿、毛利率22.44%),这家公司有两块主营业务,第一块也是像德赛西威一样主要做汽车电子中的车载信息娱乐系统,第二块业务是精密压铸板块,然而随着近年来网络储存技术和硬件储存技术的进步,成本也在降低,而视盘机市场有效需求在不断减少,整体销售下滑。而公司精密电子部件板块的收入主要来自生产视盘机机芯以及制造视盘机的相关零部件业务,并且占比较大。而另一家与德赛西威主营业务相似的汽车电子公司索菱股份(营业总收入14.98亿、净利润1.42亿、加权平均资产报酬率8.78%、研发投入1.16亿、毛利率33.37%)目前正在放弃传统的车载信息娱乐系统生产,而向自动驾驶方向转型。我的看法是,华阳集团是一个弱化版的德赛西威,目前传统的车载信息娱乐系统市场正在受到严重冲击,而索菱股份已放弃原有主营业务,目前是否在自动驾驶领域具有技术优势无法确定,因此,我的看法是,不将华阳集团和索菱股份放入股票池中。
在智慧金融领域中,新北洋(营业总收入18.60亿、净利润3.49亿、加权平均资产报酬率11.12%、研发投入2.29亿、毛利率44.07%),新北洋创立初期主要以打印扫描产品的开发、生产、销售和服务,掌握打印扫描领域的核心技术,主要是热敏打印头(TPH)、接触式图像传感器(CIS)。
目前新北洋主要业务有两部分,第一部分是金融及物流行业,代表有智慧柜员机的模块零部件生产,在智慧柜员机中,读卡、身份识别、打印、宽幅扫描等是传统基础模块,而最核心的模块是票据处理和现金扫描,新北洋是唯一拥有这个模块技术的企业。新北洋这些模块主要提供给智慧柜员机行业的垄断者长城、恒银金融、浪潮、证通电子等整机供应商。新北洋也在努力向整机供应商转型,争取更高的利润。另一个产品是新北洋控股子公司数码科技是丰巢科技智能物流柜的核心提供商。
第二部分是在新零售行业,新北洋在新零售领域一直都有研发投入,目前已经积累了生物识别、条码识别、RFID、冷链保鲜等技术,公司的主力产品自助售货机将成为公司发展中的重要业务。我的看法是,新北洋过去三年来加权净资产收益率在10%以上,它的主力产品:智慧柜员机、智能物流柜以及自助售货机都是营收高速增长的产品,我的看法是将新北洋放入股票池中。
赢时胜(营业收入5.37亿、净利润2.08亿、加权平均资产报酬率7.92%、毛利率82.7%,研发支出1.92亿),赢时胜是一家以开发金融资产管理系列专用软件为核心的高科技企业,专注于提供资产管理、托管业务信息系统解决方案,主要有“资产管理系统”(AMS1)和“资产托管系统”(ACS)两大产品线,包括财务估值软件、托管清算软件、投资监管软件、信息披露软件等。托管银行为公司重要的营收来源,根据2016年报显示,赢时胜前五大客户是建设银行、中国银行、光大银行、中信证券、农业银行,这五大客户收入占软件销售总额比例为31.29%。
我的看法是赢时胜虽然过去三年来的加权净资产收益率不到10%,但是它投入了较高的研发费用,且主要客户为商业银行,不受经济周期的影响,我认为赢时胜在金融软件技术优势要超过金证股份,我选择将赢时胜列入股票池中,因为它可能是最好的金融IT软件公司投资标的。
在传媒娱乐领域中,昆仑万维(营业总收入34.36亿、净利润14.18亿、加权平均资产报酬率11.46%、研发投入2.82亿、毛利率79.78%),昆仑万维的主营业务主要有三个,第一个是移动游戏平台(昆仑游戏),第二个是休闲娱乐社交平台(闲徕互娱),第三个是社交平台(Grindr)。公司近期收购了Opera公司,持股比例为67.5%,Opera是一个桌面浏览器,这个浏览器据介绍是一个老牌浏览器,曾经是与IE,Firefox瓜分了市场,但是近期经营不善,对信息流趋势发展反应滞后的原因,只占到了全球浏览器的1.27%,可以说是被Chrome完全代替了。
我的看法是昆仑万维作为一家社交媒体和内容平台,它的商业模式就像黑色家电的快速消费品,每一款产品生命周期短,且业绩难以预测,这类企业目前处于与A股美股化的趋势,即市值不断降低,同时流动性较差,这很大程度的原因是,快速消费品上市公司业绩不稳定,过多依靠明星产品的爆发,而是否能做出爆款游戏只是靠运气,由于业绩难以预测,我选择将昆仑万维列入股票(观察)池中,而不列入股票池中。
捷成股份(营业收入43.66亿、净利润10.74亿、加权平均资产报酬率11.43%、研发投入1.53亿、毛利率41.83%),捷成部分比较重要,因此我们专门讲述一下,公司主营业务有三块,分别是影视内容业务方面、新媒体版权运营业务、在音视频技术业务方面。其中在影视内容业务方面,公司下设文化集团作为公司在影视内容领域的业务实施平台,具体通过旗下中视精彩、瑞吉祥、星纪元三家主要从事音视频的内容制作与发行业务的影视公司,扩展影视剧制作产业链。此项业务是2015年之后才有的,公司在这项业务上,相对于其他的影视类公司优势非常明显,首先在后期技术上,公司有技术基础,其次在发行上,公司有广电网络客户资源以及线上发型资源(华视网聚)。更重要的是公司影视剧投资上比较稳重,不追求爆款,更注重盈利,优先投资风险小的电视剧,逐步试水电影。从今年的电影投资上看,已是非常成功,参投《战狼2》、《羞羞的铁拳》《建军大业》等。此项业务收入2016年、2017年分别都实现了不错的增长。
第二块是新媒体版权运营业务,公司通过收购华视网聚进入影视剧版权运营业务。影视剧版权在我国长期得不到足够重视,版权运营业务在我国还处于初期阶段,未来行业发展空间巨大,华视网聚作为市场占有率第一的企业,未来发展空间可想而知。同时公司影视剧内容制作为公司拿到版权提供重要帮助,广电网络资源为版权分销提供广阔的下游资源。公司版权运营业务收入在2016年、2017年都实现了大幅增长。
需要说明的是,华视网聚是做B2B的,与爱奇艺、土豆优酷等视频点播网站B2C模式不同。华视网聚实际上是爱奇艺、土豆等视频点播网站及各电视台的上游供应商,与这些视频网站不行形成直接竞争。从行业属性来看,版权运营业务最为重要竞争力在于版权储备的质量和数量。这种情况下华视网聚的业务附加值是较高的。
在音视频技术业务方面,公司在广电领域的市场占有率保持绝对领先,在一线卫视的市场占有率大概约70%。音视频技术业务特性决定了其具有高壁垒,这为公司技术业务构筑了护城河。首先,公司音视频技术业务具有一定技术壁垒,不仅需要对广电行业形成深入理解,还需具备先进的技术服务能力,对于非编制作业务尤是如此,一般企业难以介入。其次,公司主要客户群体为广电、政府、部队等,此类客户需要高质、安全、可靠的服务,要求服务商具备良好的信誉和丰富的经验,一般需要具有过往业绩支撑方能获得客户的信任和青睐,新竞争者难以进入。故而自上市以来,公司音视频技术业务始终保持盈利,未曾发生亏损。
但近年来广电行业景气度有所下降。一方面,在线视频等新媒体的崛起对传统广电形成了剧烈的冲击,广播电视广告收入增速在2012年后显著放缓,2015年已几近停滞;另一方面,全国公共财政中的广播电视支出增速也自2012年起大幅下滑。由于广电系统的音视频系统建设和改造支出主要来自上述两者,加之受到始于2014年广电系统反腐影响,央视及省级卫视多名高级职员遭到调查或拘留间接对行业需求形成负面影响,近年音视频技术业务需求趋于疲弱。这也是捷成股份在近几年大肆并购的原因。
A股上市公司有些公司是靠着不停的外延并购支持着业绩不断上涨,但这也是一柄双刃剑。因为大部分的收购都是要溢价的,而这些超过被并购方的净资产或公允价值的部分会形成商誉。而并购完成后,如果被收购公司业绩不达标,是需要进行商誉减值计提的并直接冲抵当年利润。最有名的商誉减值案例当属外延并购较多的蓝色光标了。我的看法是捷成股份是一家传统的以音视频技术起家的传媒类股票,目前他在向影视剧内容制作和版权运营转型,在这个过程中,他进行了对于华视网聚的高额溢价并购,这是近两年来捷成股份股价下跌的重要原因,但随着并购的完成,捷成股份仍是一家优秀的传媒类公司。我的看法是将捷成股份列入股票池中。
飞利信(营业总收入22.20亿、净利润4.14亿、加权平均资产报酬率6.95%、研发投入1.35亿、毛利率41.63%),公司是智能会议行业标准制定者,拥有自主研发的核心技术-PRSMBus(流媒体实时总线),形成了智能会议系统整体解决方案,是司智能会议龙头,2017年度智能会议业务继续保持30%以上的高速增长,有望在未来继续拓展高端智能会议市场。目前公司的主营客户是企事业单位与行政单位,公司专攻的领域是智慧城市,例如城市运行指挥中心,政务管理的运营服务等(毛利率为39.94%),我的看法是,飞利信近年来进行了大量外延并购,其业绩难以确定,且主营业务技术并不占明显优势,我选择不将它放入股票池中。
分众传媒(营业总收入120.13亿、净利润59.73亿、加权平均资产报酬率57.89%、研发投入2.24亿、毛利率72.72%),分众传媒是做电梯广告的,目前市场占有率大概是95%,行业第二名的营业收入不到分众传媒的五十分之一。2017年年报中的三个财务数据:毛利率72.7%,净利率(净利润/总营业收入)50%,净资产收益率67.6%。这意味着这家公司有极强的竞争优势,有宽阔的护城河,很有可能是行业的垄断者。2017年分众传媒的120亿总营收中电梯广告占到了其中的94亿,分众传媒不仅在市场占有率上具有护城河,而且它具有很好的广告创意。我的看法是尽管广告行业属于快消品,变动很快,但由于分众传媒财务数据较好,我将它列入股票池中。
风雨筑(营业总收入14.99亿、净利润1.66亿、加权平均资产报酬率12.87%、研发投入0.48亿、毛利率28.65%),风雨筑是一家室内建筑设计公司,主要做展馆内部施工总包,它的产品主要有三块,分别为城市展示系统、主题空间展示系统、园区展示系统,我的看法是风雨筑是一家较为专业的建筑设计公司,但建筑设计本身属于快速消费品,建筑设计风格转换很快,这样的公司难以运用标准的产品进行大规模工业化生产,这就导致了公司的市值无法做的很大,投资者必须是一级市场的PE机构,而不是散民投资者。我的看法是将风雨筑列入股票(观察)池中,但不列入股票池中。
恺英网络(营业总收入31.34亿、净利润16.86亿、加权平均资产报酬率33.38%、研发投入2.31亿、毛利率70.70%),恺英网络是一家依靠游戏产品收入为主营业务的公司,它曾经推出一款手机游戏《全民奇迹》,成为爆款,然而对于传统的游戏类公司来说,最重要的是研发运营中的精品战略,游戏属于快速消费品,风向变化很快,业绩难以预计,这就使得游戏类上市公司的拓展价值不如掌握云计算技术的软件公司,例如东软集团等。我的看法是由于游戏产品风向变化很快,更适合进行一级投资,而不适合在二级市场进行投资,因此我选择不将恺英网络列入股票池中。
迅游科技(营业总收入2.78亿、净利润1.01亿、加权平均资产报酬率3.39%、研发投入0.41亿、毛利率73.30%),迅游科技主要有三块业务,第一块是迅游网游加速器,它可以加速PC端网络游戏运行速度,然而随着光纤入户、宽带提速、硬件基础设施的完善,网速渐渐不再成为瓶颈,很多从事类似业务的产品都陷入了困境,比如做下载的迅雷、做CDN分发的网宿科技,同时网易推出了免费的网游加速器网易uu,这使得迅游科技主营业务网游加速器走向衰弱;公司第二块业务是迅游手游加速器,在2016年下半年完成,与腾讯的手游王者荣耀建立合作关系;公司第三块业务是在2017年并购狮之吼获得了海外流量广告业务,这是一种游戏类公司低配版的多元化经营方式,狮之吼的主营产品是手机工具类软件,例如Power Clean,可以通过自身产品被使用流量获得广告收入。我的看法是由于迅游科技自身产品技术门槛不够高,手机游戏以及网游手游加速器领域,技术门槛有限,很容易被颠覆,因此,迅游科技不应列入股票池中。
其它类型公司有闻泰科技(营业总收入169.16亿、净利润3.34亿、加权平均资产报酬率9.30%、研发投入7.87亿、毛利率8.97%),闻泰科技最早是一家ODM代工电子类企业,这里解释一下,ODM(原始设计制造商)是产品代工的一种形式,指一家厂商根据另一家厂商的规格和要求,设计和生产产品。受委托方拥有设计能力和技术水平,基于授权合同生产产品,使得委托方减少研发时间和成本,闻泰科技ODM业务的主要客户为华为、小米、联想、MOTOROLA、魅族、中国移动、华硕等主流手机品牌,是中国手机ODM出货量最大的企业。
闻泰科技收购了安世半导体,安世半导体前身为恩智浦标准产品事业部,有60余年半导体专业知识,是全球分立器件、逻辑芯片和MOSFET市场领导者,其中分立器件全球第一,逻辑芯片和MOSFET功率器件全球第二。安世半导体集半导体设计、制造、封测于一体,属于典型的垂直整合半导体公司(IDM),盈利能力强。闻泰科技在本次交易完成后,将成为中国目前唯一拥有完整芯片设计、晶圆制造、封装测试的大型IDM企业,未来在移动通信、智能汽车、物联网等领域都有强劲的增长潜力,发展空间巨大。
这里需要说明一下,全球半导体产业有两种商业模式,一种是IDM(Integrated Device Manufacture,集成器件制造)模式,另一种是垂直分工模式。1987 年台湾积体电路公司(TSMC)成立以前,只有IDM 一种模式,此后,半导体产业的专业化分工成为一种趋势。出现垂直分工模式的根本原因是半导体制造业的规模经济性。现今IDM 厂商仍然占据主要地位,主要是因为IDM 企业具有资源的内部整合优势、技术优势以及较高的利润率。我的看法是闻泰科技通过收购安世半导体后,已经由原来低附加值的ODM厂商升级为产品高附加值的IDM垂直整合半导体厂商,我认为闻泰科技并购安世半导体,该收购需要至少两到三年磨合期,才能产生效益,我的看法是将闻泰科技列入股票(观察)池,但在2020年前不要列入股票池中。
苏州科达的第二块业务是视频监控,这一块业务是海康与大华的双寡头格局,苏州科达在视频监控中处于劣势,同时,由于公司每年前端设备的出货量不及海康、大华,导致采购海思、高通等厂商的芯片时价格较高,成本也更高。我的看法是苏州科达在视频会议与视屏监控两个子行业的主营业务均相同,但在视频监控领域远不如海康和大华,苏州科达目前还没有形成技术占优的主力产品,因此我选择将苏州科达列入股票(观察)池中。
绿盟科技(营业总收入12.55亿、净利润1.53亿、加权平均资产报酬率6.48%、研发投入2.89亿、毛利率75.19%),公司是一家传统的做网络安全的公司,主要服务于政府、电信运营商、金融、能源、互联网等领域的企业级用户,向用户提供网络及终端安全产品、Web及应用安全产品。公司建立并维护的全球最大的中文漏洞库。绿盟科技的问题在于它进行了较多的外延收购,在2014年9月,绿盟科技收购了亿赛通,亿赛通主营数据安全和网络内容安全管理产品的研发,是国内最早从事数据安全防护业务的企业之一,华为、太极股份、广发证券、启明星辰等均为其客户。亿赛通传统的文档加密业务收入平稳,而从2016年开始,亿赛通转型做DLP产品(数据泄露防护系统)的国产化,由于没有研发出产品,所以绿盟科技的外延并购策略出现了亏损。我的看法是绿盟科技习惯于外延式并购,作为软件公司业绩不稳定,难以预测,近三年来绿盟科技加权净资产收益率已经下滑至接近5%,我选择不将绿盟科技列入股票池中。
新大陆(营业总收入49.19亿、净利润6.79亿、加权平均资产报酬率20.61%、研发投入3.96亿、毛利率30.84%),新大陆早年是金融末端设备产品提供商,公司专注物联网领域,主业为条码识别和电子支付两个领域。在条码识别上,新大陆是中国条码识别产业链最完整的企业,致力条码技术,特别是二维码技术在智能化终端与数据采集设备的应用。在电子支付领域,全球首创二维码解码芯片,支付宝和微信条码支付市场占有率90%以上。
新大陆同时也是"数字福建"一号工程——政务信息网络工程总集成商,在数字福建的建设中,还有一家计算机企业是做电子政务云的南威软件,但是显然新大陆的重要性更大,同样新大陆在大数据的产业链中位置更重要。我的看法是新大陆的产品毛利率为30%,过去三年来加权净资产收益率平均可达13%以上。是一家优秀的物联网与移动支付平台投资标的,我认为应当将新大陆列入股票池中。
以上是关于证券研究中的量价时空:时光旅行流媒体与视频识别我眼中的计算机股(第二篇) (证券研究系列连载之四十五)的主要内容,如果未能解决你的问题,请参考以下文章