ChatGPT 再遭禁用 | 人工智能时代下数据安全如何保障

Posted CloudQuery

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ChatGPT 再遭禁用 | 人工智能时代下数据安全如何保障相关的知识,希望对你有一定的参考价值。

近日,三星电子宣布禁止员工使用流行的生成式AI工具,原因在于4月初三星内部发生的三起涉及 ChatGPT 误用造成的数据泄露事件。报道称,三星半导体设备测量资料、产品良率等内容或已被存入ChatGPT学习资料库中。

去年11月上线以来, ChatGPT 一直是科技领域的焦点。上线短短5天,注册用户数就超过100万,一举成为史上增长最快的消费者应用。几个月来,不少企业将其嵌入工作环境,利用人工智能提升工作效率,其中包括微软、亚马逊等行业巨头。4月份,三星电子也引入ChatGPT,结果不到20天就曝出文章开头出现的机密数据外泄事件。

人工智能强大的存储、检索和生成功能对数据安全提出了更高要求,全面禁止并不是拥抱新技术的最佳选择。AI 时代下,怎样更好地守护数据安全呢?

追溯一起数据泄露事件背后的原因,往往会涉及技术缺陷和人为操作。保障数据安全,也要双管齐下。从技术上给数据库罩上“金刚罩”,保障数据流动严进严出;在管理上合理分配操作权限,审批操作流程,全方位进行管控。目前市场上的数据库管控产品已经给出了解决方案,那么,作为一体化数据库安全管控平台的 CloudQuery 又是如何实现这些要求的呢?

1.技术上:严格进出,细分权限

统一访问入口

传统的权限控制中,通常是 DBA 为不同的人员分配不同权限的数据库帐号,拥有帐号的人员在各自的环境中访问数据库。而使用 CloudQuery,与数据库的通信连接都建立在受信任的部署服务器上,整个平台作为数据库的统一访问入口。
CloudQuery 通过统一管控,收敛其他数据库访问入口,支持用户便捷接入 HTTPS,在外网环境使用 HTTPS 协议访问 CloudQuery,可以有效防止通信内容被窃听和篡改的风险。提升数据操作效率的同时,在数据流向的各个环节提供统一的数据安全防护措施。

权限管控

CloudQuery 支持细粒度的权限管控,如操作对象、操作类型、操作时间、影响行数、操作次数等多因素进行管控,避免高权限账号滥用风险,限制越权操作、高危操作。

数据导出权限

CloudQuery 严格遵循数据保护制度的企业级数据导出,包括精细化的权限控制,如查询与导出权限分离,并能根据导出人的权限,控制导出数据对象(精确到字段级)、导出时间(精确到分钟)、导出行数。

数据导出时还将进行严格的行为审计,包括记录导出行为的发起人、客户端IP、SQL语句、执行时间、导出时间、影响行数等信息。审计人员可随时搜索与查看导出记录以及导出数据。

受限资源权限

CloudQuery 支持自定义高危操作,高危提权复核方式支持同步复核。设置成功后,高危操作将被禁止,第一时间保护重要数据。

动态脱敏
CloudQuery 支持数据动态脱敏。无须改变生产数据库中的数据,即可依据用户级别、数据级别,对数据库返回数据进行差异化地脱敏。确保不同角色的用户能够差异化地访问数据库中的敏感数据。具有以下核心功能:
1.内置规则脱敏。根据提前设置的脱敏策略,自动对呈现的结果集进行脱敏。此规则适用于所有数据,适用于所有没有明文数据查询权限的用户。
2.指定字段脱敏。管理员可以设置脱敏策略,并对指定字段进行脱敏。
3.数据导出脱敏。在对数据进行导出时,自动根据内置规则以及设定的脱敏策略对导出数据进行脱敏。
4.敏感数据自动发现。数据库管理员可建立扫描任务,并根据扫描规则,从大量数据资源中快速发现和定位敏感数据,并呈现给管理员决定是否需要对该数据进行脱敏。

2.管理上:提权审批,行为审计

流程申请和审批

三星此次数据泄露更大程度是由于内部员工的不当操作。据报道,三星DS部门的A职员,将有问题的原始代码复制到 ChatGPT,并询问了解决方法;同部门的B职员将为了控制产量、不良设备而编写的源代码输入到ChatGPT,并要求其优化。

为了防止内部员工的越级提权和不当操作,CloudQuery 设有流程申请和审批模块。当普通用户需要某些权限时,需要向管理员发起流程申请。管理员可管理流程,如设置审批人、将审批进行转审、将审批流程自定义为一级/二级/多级审批等。通过审批人层层批准后普通用户才可进行提权操作,有效防止了内部员工不当操作引发的数据泄露。

查看审计日志

CloudQuery 会记录使用过程中的语句明细和操作明细,针对数据库的操作行为,进行操作中的同步监控,操作后的全方位审计。包含系统管理类和安全行为的审计,并留存日志和记录,记录sql执行人账号、ip、语句等信息。

CloudQuery 通过动态监测用户的操作行为,并通过页面展示详细的行为记录和安全趋势,实现精准的行为审计,保障企业数据安全。

系统监控功能

CloudQuery 具备主机监控和容器监控功能,可对自身平台所在服务器运行状态进行监控,查看CPU使用率与总体率、分区状态、流量状态等。还支持对容器运行状态进行监控,管理者可随时登录,及时查看服务运行状态,未雨绸缪应对数据安全事故。

数据是数字化时代的金矿,数据安全是企业行稳致远不可或缺的保障。CloudQuery 作为一体化数据库操作管控云平台,最大程度上确保了数据不泄漏、操作可管控的防护能力,为企业的智能化升级提供安全保障。

机器学习0 — 总体架构,chatgpt时代必须掌握的

1 从chatgpt看目前AI重要性

随着chatgpt的一声巨响,拉响了强人工智能的序幕。chatgpt相对于目前的各种机器人,简直就是弓箭和导弹的区别。沉寂了两三年后,AI如今又一次站在了人类工业的最高舞台。个人认为AI已经成为所有人,特别是程序员,必须了解甚至掌握的一项基本技能,原因如下

  1. 需求端越来越爆炸。随着人口负增长时代的来临,以及肉眼可见的愈演愈烈,机器辅助甚至替代人类劳动,已经刻不容缓。AI对于各行各业产能提升意义重大,已经成为国家与国家之间竞争的核心
  2. 技术端越来越成熟。chatgpt能力强大到让人难以置信,不论是多轮对话语义理解,还是文本生成,都已经十分成熟。它可以知识解答、闲聊陪伴、任务助理、撰写诗歌小说甚至论文,前两天连数学能力这一短板也补齐了。毫不夸张的说,chatgpt目前具备的能力,已经足够成为一个真正意义的AI机器人。最重要的是,chatgpt让人相信强人工智能完全可能落地,不再是所谓的江湖骗子。chatgpt帮我们在无人区探索了一条光明大道,完成了从0到1的验证,后面谷歌、亚马逊、阿里等各大公司只会更拼命的跟进,技术进步也会越来越快。
  3. 应用面越来越广泛。chatgpt主要面向NLP领域,如语义理解、文本生成等。据说下一阶段就是文本、图像的多模态机器人。后续肯定也会在语音、视频等更多领域遍地开花。AI在各行业的落地也正如火如荼的展开,极大的提升了各行业的生产力。有人甚至传言,未来教师、程序员、蓝领工人、司机,都有很大的职业危机。AI已经成为全行业的基础设施,各行业完全可以利用AI重新再做一次,就像10年前的移动互联网一样。

对于已经从事AI行业的人来说,恭喜你,处在了还不错的时代,可以坚定不移的走下去。对于还没有进入,但有兴趣进入这个行业的人,目前也不算晚。机器学习是人工智能的基础理论,学习难度也比较大,因此我整理了一个系列博客,从各方面讲解机器学习的原理。

2 机器学习总体架构

机器学习内容很多,理论也十分复杂。我这边参考李宏毅老师的课件,分成了17个章节。总体架构如下图所示,包含了每个章节的知识架构。各章节具体内容,请移步文章最后的链接。

 各章节详细内容,请移步

机器学习1 -- 梯度下降(Gradient Descent)https://xieyangyi.blog.csdn.net/article/details/108267463

机器学习2 -- 优化器(SGD、SGDM、Adagrad、RMSProp、Adam等)https://xieyangyi.blog.csdn.net/article/details/108268525

机器学习3 -- 误差来源(偏差bias和方差variance)https://xieyangyi.blog.csdn.net/article/details/108278303

机器学习4 -- 反向传播(back propagation)https://xieyangyi.blog.csdn.net/article/details/108294176

机器学习5 -- 为什么深度学习需要加深?https://xieyangyi.blog.csdn.net/article/details/108296861

机器学习6 -- 深度学习训练优化https://xieyangyi.blog.csdn.net/article/details/108306983?spm=1001.2014.3001.5502

机器学习7 -- 可解释学习https://xieyangyi.blog.csdn.net/article/details/108336178

机器学习8 -- 模型攻防(model attack & model defense)https://xieyangyi.blog.csdn.net/article/details/108495755

机器学习9 -- 模型压缩和加速https://xieyangyi.blog.csdn.net/article/details/108500392

机器学习10 -- 半监督学习 Semi-supervised Learninghttps://xieyangyi.blog.csdn.net/article/details/108539697

机器学习11 -- 无监督学习之Auto-Encoderhttps://xieyangyi.blog.csdn.net/article/details/108547217

机器学习12 -- 无监督学习之线性模型(clustering、PCA、MF)https://xieyangyi.blog.csdn.net/article/details/108549365

机器学习13 -- 无监督学习之自监督 self-supervisedhttps://xieyangyi.blog.csdn.net/article/details/108553383

机器学习14 -- Transfer Learning 迁移学习https://xieyangyi.blog.csdn.net/article/details/108566050

机器学习15 -- Meta Learning 元学习https://xieyangyi.blog.csdn.net/article/details/108580449

机器学习16 -- Lifelong Learning 终生学习https://xieyangyi.blog.csdn.net/article/details/108584923

机器学习17 -- GAN 生成对抗网络https://xieyangyi.blog.csdn.net/article/details/108603760

以上是关于ChatGPT 再遭禁用 | 人工智能时代下数据安全如何保障的主要内容,如果未能解决你的问题,请参考以下文章

ChatGPT的了解与初体验

AI时代来临,如何把握住文档处理及数据分析的机遇

机器学习0 — 总体架构,chatgpt时代必须掌握的

人工智能时代- 是时候改变学习方法了!

人工智能时代- 是时候改变学习方法了!

直面风口,未来不仅是中文版ChatGPT,还有AGI大时代在等着我们