这次, AI 也帮不了我

Posted 云水木石

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了这次, AI 也帮不了我相关的知识,希望对你有一定的参考价值。

这段时间一直在改造 Chromium for android,详情参考前文:

在增加 TS 格式支持的时候,还参考了一下 AI 的意见:

在增加了所要支持的音视频格式后,正准备收工时,突然发现一个更大的麻烦:RTSP 协议支持。

先简单介绍一下 RTSP 协议:

RTSP(Real Time Streaming Protocol)是由 Real Network 和 Netscape 共同提出的如何有效地在 IP 网络上传输流媒体数据的应用层协议。RTSP 对流媒体提供了诸如暂停、快进等控制,而它本身并不传输数据,RTSP 的作用相当于流媒体服务器的远程控制。服务器端可以自行选择使用 TCP 或 UDP 来传送串流内容,它的语法和运作跟HTTP 1.1 类似,但并不特别强调时间同步,所以比较能容忍网络延迟。而且允许同时多个串流需求控制(Multicast),除了可以降低服务器端的网络用量,还可以支持多方视频会议(Video onference)。因为与 HTTP 1.1 的运作方式相似,所以代理服务器的快取功能也同样适用于 RTSP ,并因 RTSP 具有重新导向功能,可视实际负载情况来转换提供服务的服务器,以避免过大的负载集中于同一服务器而造成延迟。

关于 RTSP 协议,了解到的情况是:

  1. Chromium net 模块不支持 RTSP 协议。

  2. FFmpeg 支持 RTSP 协议。

  3. Chromium media 模块的视频流的网络获取是通过 Chromium net 模块,FFmpeg 只是进行 demuxer 和解码。

有了上次的经验,这次,我也求助一下 AI。

这个回答有点不靠谱,特别是参考链接 3,指向的是一篇关于健康的文章,显然 AI 把 Chromium 认作这种微量元素了。接着提问:

这个回答还可以,至少点明了修改的思路。其中链接 1 给的文章,似乎某位开发者已经修改过 Chromium net 的代码以支持 RTSP,但这篇文章明显是搬运过来的。链接 2 的文章是分析 Chromium net 源码的,对于理解 chromium 处理 HTTP 请求有所帮助。链接 4 是一个开源库,将 Chromium net 抽出来单独编译,进去看了一下,没有 RTSP 协议支持,参考价值不大。

我想看看链接 1 是否也有源码,于是继续提问:

AI 误会了我的意思,RTSP 这种成熟的协议,肯定有不少开源实现,我这不是为了省事吗?接着提问:

链接 1 和 2 实际上是重复了第一个回答,而且第二点概括错误,并没有利用 libavformat 库。链接 3 的插件模式并不适合本项目。既然中文世界没有找到答案,那有没有英文资料呢?

又回答偏了,再次拉到 Chromium net 上来:

看来真问不出什么内容了。突然冒出一个主意,绕过 Chromium net,让 FFmpeg 直接处理呢?

这个答案不行,接着问:

到此,我已经明白,再也问不出什么实质性的内容来。

前面提到一位老哥已经做了 Chromium net 中添加 RTSP 的功能,只可惜那是一篇搬运的文章,找不到原主,那就从这条线索再追问下去吧。

看来微软的 bing 也对 CSDN 情有独钟,搜去搜来都是 CSDN 上的那几篇文章。

最后,还是抬出谷歌,在下面的链接找到了原文章:

https://www.cswamp.com/post/41

遗憾的是,没有源码,而且貌似所使用的 Chromium 也是比较老的版本。看来只能自己啃一啃 Chromium net 的源码。

一想到协议实现就头大,没有什么捷径,必须参考 RFC 文档,按着规范来,一丝一毫都不能出错。光是 RFC 文档看起来就挺头疼,细节太多。不过目前也没有更好的办法,指望 AI 来帮忙写代码是不可能的,工作上的问题,没有条件可讲,没有条件也要创造条件上。唯一值得庆幸的是,这肯定是一条可行的道路,不像做预研,能做到什么程度心里没底。

改造 Chromium net 又会碰到哪些坑呢?欢迎围观。

GPT-4:不了不了,这些我还做不到

还有什么是GPT-4玩不了的?

ChatGPT的余波未平,GPT-4的风波又起。这次GPT-4的全新升级,再一次突破了技术的壁垒,很快受到众人的追捧:
有人说GPT-4的出现是场变革,但也许只是对人工智能的过度炒作;
有人说GPT-4可以直接生成好莱坞电影,但也许是对GPT-4的期望值过高;
有人说GPT-4能改变世界,但接下来的发展是什么,还不一定……

 

GPT-4到底能做什么?又做不到什么?

纵观GPT系列模型的发展史:

第一代模型GPT-1,开始探索模型对语言的理解力;
第二代模型GPT-2,找到了“多任务学习者”的方向;
第三代模型GPT-3以及在此基础上微调的GPT-3.5,也是ChatGPT的前身,能够通过数据的喂养,实现智能问答交流。

而此次GPT-4的发布,又让人眼前一亮。

问题来了:GPT-4比前几代模型到底好在哪?

ChatGPT是这样回答的:

01:GPT-4能识别图片

“GPT-4可以接受图像作为输入并生成说明、分类和分析,”这意味着只要你想识别,GPT-4就能识别图像并输出文本内容。GPT-4开始能“看到”世界。

这一功能的出现,对于有视觉障碍的人群来说,无疑为提高他们的生活便捷打下了坚实的基础。GPT-4在这一方面也有了具体的应用:一款名为Be My Eyes的APP正在开发GPT-4驱动的虚拟志愿者,希望能为盲人、低视力群体提供视觉帮助。

不过据官方宣布图像输入仍然是研究预览,并未公开。关于这一功能的更多信息,我们不得而知。只能期待在下一次的版本中,能带给我们更多的惊喜。

02:创作能力得到强化:长篇小说不是梦

OpenAI表示:“GPT-4能处理超过2.5万字的文本,它比以往任何时候都更具创造力和协作性。

对GPT-4来说,它可以生成文字内容并进行编辑,甚至可以进行作曲、写剧本或模仿使用者的写作风格。OpenAI的联合创始人Greg Brockman也通过直播展示了GPT-4惊人的创作能力——对长篇文章做核心总结、写代码、创作诗歌……

可以看出,GPT-4不再局限于“chat”,不再定位于聊天机器人,而是朝着提高生产率、“多栖”方向出发。

03:GPT-4更智能、更聪明

相较之前的版本,GPT-4能更好地理解上下文语境及相应的文本关系。OpenAI也给出了GPT-4与GPT-3.5参加各种考试的成绩。在模拟律师考试结果中,GPT-4的最终分数在应试者的前10%左右,而GPT-3.5的得分大概在倒数10%左右。两个模型版本之间,差异也较为明显。

在这场涉及了“人性”“伦理道德”的考试中,GPT-4取得了不错的成绩,显然比GPT-3.5表现得更为出色。

04:GPT-4的安全性也得到提升

“GPT-4及后续模型有可能以有益和有害的方式对社会产生重大影响。”OpenAI表示,团队也在对GPT-4不断地迭代,就安全性这一问题做出了很多努力,包括对数据的选择和过滤、评估和专家参与、模型安全性的改进以及监测、执行等。

针对GPT一类的模型会生成不良建议、有Bug的代码或不准确的信息等风险问题,团队也聘请了50多位来自人工智能对齐风险、网络安全、生物风险、信任和安全以及国际安全等领域的专家,对GPT-4的这些高风险行为进行对抗性测试。这些专家的反馈和数据为GPT-4的改进提供了依据。

GPT-4自发布以来,话题热度只增不减,一些网友也玩出了新花样:

“天呐!GPT-4竟然能雇佣一名人类工作人员为它解决验证码问题,并说服人类与它合作。”

(图源Yosarian2@YosarianTwo)

用户@ GauravDungriyal给GPT-4拍了一张自家冰箱的照片,并让其提供菜谱:

但,GPT-4就没有任何问题吗?

GPT-4与前几代模型相比,回答的内容更精确、也更丰富,但也出现了一些问题:

1、回复变慢

猜测原因可能有以下方面:
首先是流程更复杂。GPT-3有1750亿参数,而GPT-4有100万亿参数,什么概念?这与人类大脑神经元数量相当!因此非常消耗算力;
GPT-4的提问是有限制的,每四个小时内不能超过100条消息。由此可见,它的处理能力更加多样化;
GPT-4 是个多模态大模型,由原来的文本处理,到支持图像输入等,整体运作也更为复杂了。

2、 仍存在一些漏洞

尽管此次发布,GPT-4比之前模型的安全性有所提升,但它依旧具有局限性:它有时也会犯简单的推理错误,或在接受用户明显的虚假陈述时过于轻信。有时它也会像人类一样在难题上失败,比如也会在它自己生成的代码中引入安全漏洞。

3、 时间数据采集没有拓宽

在数据采集上,GPT-4依旧缺乏2021年9月之后发生的事件数据。这意味着,在时效性上,GPT-4无法做到及时同步,它无法回答21年之后发生的事件,更无法从其经验中吸取教训。

 

AI对我们的影响,取决于我们如何定义它。在人类与AI的故事中,与其在科技发展浪潮中战战兢兢,不如成为AI的创造者,创造下一个GPT-X!

以上是关于这次, AI 也帮不了我的主要内容,如果未能解决你的问题,请参考以下文章

安防摄像头网页无插件直播方案流媒体服务器EasyNVR之AI_Filter功能无法使用自编的ffmpeg库问题解决

GPT-4:不了不了,这些我还做不到

学习编程要趁早,边玩边练少不了

都说AI门槛高!普通人就真的学不了吗?未必!

人类又被AI碾压,这次是星际争霸

全网最详细中英文ChatGPT-GPT-4示例文档-智能AI辅助写作从0到1快速入门——官网推荐的48种最佳应用场景(附python/node.js/curl命令源代码,小白也能学)