城市沙龙LiveVideoStack Meet|杭州:多媒体新黄金时代

Posted LiveVideoStack_

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了城市沙龙LiveVideoStack Meet|杭州:多媒体新黄金时代相关的知识,希望对你有一定的参考价值。

从PPTV、六间房、土豆网,到小米、美团、滴滴、快手、字节跳动,过去20年流媒体应用从PC互联网和宽带时代,过渡到智能手机和4G时代。未来随着基础设施不断升级,新的流媒体创新将会不断涌现。11月14日LiveVideoStack Meet走进杭州,本次沙龙嘉宾阵容豪华,内容丰富,期待与你一同分享关于多媒体的新黄金时代。

讲师与议题

曹成坤

粤港澳大湾区数字经济研究院计算机视觉资深研究员

LiveVideoStack Meet

曹成坤,现任粤港澳大湾区数字经济研究院(简称IDEA)计算机视觉资深研究员,是最早加入CTO Labs计划-光场实验室的研究员,毕业于北京大学信息科学技术学院。曹成坤博士现阶段研究方向为实时人脸重建和深度图估计算法,以及低成本光场相机技术的落地应用。曾为虎牙数字人技术团队的核心成员,参与3D数字人制作算法的研发,并主导了4D数字人高精度采集系统的软硬件搭建以及高精度4D重建算法的研发。曾参与大规模城市场景的3D重建,提出了高效的点云数据压缩算法及精简的建筑3D几何表示方法。曾参与国家973项目几何造型系统的研发,参与核心算法的开发和主导系统架构优化,同时成功申请模型表示国家标准。

TOPIC:光场相机与新视角合成

本次分享将介绍如何利用光场相机进行新视角合成,包括光场相机的成像原理与技术应用,利用图形学几何方法进行3D重建和4D人脸重建技术在视频合成中的应用,以及利用深度学习方法进行新视角合成的应用和挑战。


段先德

峰畅科技

联合创始人&CTO

LiveVideoStack Meet

段先德,峰畅科技联合创始人&CTO。十几年来一直从事电信领域系统设备软件、VoIP系统软件、webRTC媒体服务器系统软件的一线开发工作。是《面对软件错误构建可靠的分布式系统》中文译者、OWT(Open WebRTC Toolkit)开源项目的前架构师和主程序员,一直致力于用软件设计技术化解RTC系统的核心复杂性。

TOPIC:5G VoNR + WebRTC的视频通话落地实践

在B2C远程服务的场景中,存在大量传统语音客户服务视频化升级的需求,一般的升级方案需要客户安装app,导致服务推广困难。随着5G业务的推广和三大运营商之间VoNR(原4G VoLTE的升级版)业务的互通,以及主流移动端浏览器和ios内置WebView对WebRTC的支持,可以将原有语音通话轻微升级为视频通话,针对没有开通和不支持VoNR业务的终端,通过短信链接打开WebRTC视频的方式在原有语音通话上叠加视频。这样就以最小的系统改造将语音服务升级为视频服务。本次分享将系统性介绍这种升级的技术方案。


邹丹平

上海交通大学

副教授

LiveVideoStack Meet

邹丹平,上海交通大学副教授。他的研究兴趣为实时计算机三维视觉、同步定位与地图构建(SLAM)、无人系统自主导航。他2010年于复旦大学计算机学院获计算机应用技术博士学位,2010-2013年任新加坡国立大学博士后研究员。2013年加入上海交通大学感知与导航研究所,他在SLAM方面的代表工作有动态环境下群体协同CoSLAM (TPAMI, 2012),面向人造环境下的StructSLAM (TVT,2015) 以及StructVIO (TRO, 2019)等。他发起并连续策划了五届上海交通大学无人飞行器智能感知技术挑战赛,并在2017年推广为全国性赛事。

TOPIC:视觉SLAM发展历程、新进展与未来趋势

聚焦AR/VR应用,首先介绍视觉SLAM基本原理、技术发展历程以及现有传统方案与一些成功产品,其次介绍目前基于数据驱动的视觉SLAM新进展与突破,最后讨论视觉SLAM在AI边缘算力爆发下的未来发展可能趋势。


李宏华

阿里巴巴达摩院

XR实验室高级算法专家

LiveVideoStack Meet

李宏华,阿里巴巴达摩院XR实验室高级算法专家,长期致力于三维几何处理与三维智能设计研究,曾在ACM TOG、ICCV、CGF、SGP等顶级期刊和会议上发表论文十余篇。

TOPIC:面向全景符号识别的超大规模CAD图纸数据集

从 CAD 图纸中准确的识别各类符号,在三维建模和图纸审查等领域具有广泛的应用价值。我们建立了一个大规模CAD矢量数据集,称为 FloorPlanCAD ,包含超过一万张建筑平面图块,覆盖了包括居民塔楼、商业地产、学校医院等各种类型的场景。通过人工标注,我们赋予每个矢量元素线段级别的语义标签以及实例标签,标签类别超过三十个。

我们定义了一个全新的全景符号识别问题(Panoptic Symbol Spotting),并开创性的使用GCN和CNN相结合的方法,分别捕捉拓扑空间和欧式空间的特征。该方法可以端到端的进行训练,打败诸多传统算法,取得了当前最好的结果。


圆桌:挑战与机遇,现实与理想

包括视见睿来创始人兼CEO 周昌印(LiveVideoStack杭州城市特使)、线性资本董事总经理 黄松延灵长智能科技(杭州)有限公司CEO 苑志超微帧科技联合创始人兼CEO  朱政在内的多位嘉宾会出席圆桌。

周昌印

视见睿来公司Vistring Inc.

创始人&CEO

LiveVideoStack Meet

周昌印博士,视见睿来公司Vistring Inc.的创始人和CEO,也是计算机视觉、计算摄影、虚拟现实等领域的知名科学家与连续创业者。十几年来,他一直在全球领先的多家机构和公司研究开发最前沿的计算机视觉技术与产品。作为硅谷知名超高清VR视频技术企业Visbit的创始人&CTO,他主导研发了VVOS技术的研发与产品化,大幅提升VR视频体验;作为原Google X 实验室的高级科学家,他是谷歌眼镜采集和处理算法以及Google HDR+技术主要作者之一,参与并推动android HAL3标准的设计与普及。在加入谷歌之前,他还在微软亚洲研究院、微软雷德蒙研究院、与 Nvidia 英伟达研究院工作过。周昌印毕业于美国哥伦比亚大学计算机系,在计算机视觉、图形学与虚拟视觉领域拥有30多项专利,在顶级学术期刊或国际会议上发表近二十篇学术论文。

黄松延

线性资本董事总经理

deep tech方向投资负责人

LiveVideoStack Meet

黄松延博士,线性资本董事总经理、deep tech方向投资负责人,主导完成对思灵机器人、全应科技、海飞科、蔚建、时谛等项目的投资。担任IEEE学会多个顶刊的审稿人。曾就职于华为,任数据科学家职位。黄松延博士毕业于浙江大学信电学院,机器学习方向。


苑志超

灵长智能科技(杭州)有限公司

CEO

LiveVideoStack Meet

苑志超,毕业于牛津大学工程系,多年从事网络通信产品研发、管理与市场开发;在爱立信美国硅谷总部担任IP产品线项目总监期间,曾带领团队成功实现公司IP产品的标准化和成本优化转型以及全球推广等工作。2018年创立灵长智能科技(杭州)有限公司,带领团队以提高用户应用体验为目标针对数据传输层进行智能优化,开发出一系列极具创新型的基于人工智能的网络传输和可视化产品。


朱 政

微帧科技

联合创始人兼CEO

LiveVideoStack Meet

朱政,微帧科技联合创始人兼CEO,15年多媒体开发经验,曾从事芯片设计、语音识别,改进OpenH264码率控制。2014年作为联合创始人创立仟壹视讯,是QY265/KSC265核心作者。在金山云主导过编解码、美颜、VR/AR、连麦、AI+视频等多个研发方向。2018年创立微帧,主导研发微帧智能编转码技术产品和服务。申请发明专利30余篇。


点击阅读原文或扫描下方海报上的二维码进行报名,限时免费门票数量有限,请确保报名后不会浪费哦~

  日程海报


关于LiveVideoStack Meet你可以查看此文档:

https://shimo.im/docs/gVygrWtq9K9CPg9P,我们会在此更新各个城市的活动信息、报名入口以及城市特使名单等。

如果你想在LiveVideoStack Meet上输出talk、参与讨论,请联系 editors@livevideostack.com 。

以上是关于城市沙龙LiveVideoStack Meet|杭州:多媒体新黄金时代的主要内容,如果未能解决你的问题,请参考以下文章

城市沙龙LiveVideoStack Meet厦门:下一代互动媒体技术与产品

城市沙龙LiveVideoStack Meet|合肥:在“霸都”邂逅音视频技术

城市沙龙LiveVideoStack Meet|上海:流媒体无处不在

城市沙龙LiveVideoStack Meet|杭州:多媒体新黄金时代

城市沙龙LiveVideoStack Meet|南京:互联网沙漠的音视频发展

城市沙龙LiveVideoStack Meet|西安:人文历史遇到流媒体算法