K哥爬虫普法一个人一年半挣了2000万!
Posted K哥爬虫
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了K哥爬虫普法一个人一年半挣了2000万!相关的知识,希望对你有一定的参考价值。
我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。
案情介绍
2015年,被告人肖某开发了一款免费看小说 APP,为了牟利,肖某从腾讯广告联盟下载广告包并插入该 APP 应用程序,用户在通过该 APP 阅读小说时点击其中的广告,广告联盟会自动以点击量计算广告推广费。之后肖某注册成立“某网络技术工作室”公司,并以公司名义将 APP 陆续上架到应用商城。为通过著作权资质的审查,肖某伪造相应作品转让授权证明上传至各应用商城。
2019年,肖某成立公司开发“悦读免费小说”手机 APP 软件并上架,提供网络小说在线阅读服务。后为获取更多利益,肖某将网络爬虫程序植入 APP 应用中,自动爬取互联网上各小说网站的网页链接、小说名称、小说作者、小说简介、小说图片等信息,并分类存放于腾讯云服务器当中,且不间断更新爬取内容。用户在 APP 中搜索或点击相关信息后,APP 将自动爬取到的小说信息提取出来,发送并缓存在上述服务器中,再通过第三方网页重新排版,并插入广告公司提供的广告供用户阅读。
腾讯公司每月根据该程序中的点击量按每次单价 0.2 元至 1 元不等的价格结算广告推广费,费用转到长沙畅想网络技术工作室的银行账户。为了规避风险,肖某分别于2020年5月26日、7月17日以其父亲肖某、母亲王某的身份注册上海昶悠网络技术工作室和上海毓璃网络技术工作室,并用该两个公司的对公银行账户接收腾讯公司结算的广告推广费用。
2021年6月,北京腾飞克科技有限公司发现“悦读免费小说” APP 在未经其许可的情况下,大量非法复制了该公司享有著作权的作品。经广东甄明司法鉴定所鉴定:固定至“悦读免费小说” APP 中 576 部小说作品与永丰舸渡网络科技有限公司提供的拥有著作权的小说作品具有相同名称,其中 551 部小说作品相似度大于70%。
公诉机关变更起诉为:经广东甄明司法鉴定所于2022年2月25日鉴定,固定到“悦读免费小说” APK 文件并通过程序获得“悦读免费小说侵权书单.xlsx”同名小说 4547 本,经检验,与版权方提供的版权小说相似度大于70%的共计 3968 本。上述相似度大于70%的小说合计 4519 本。
2020年1月至2021年8月期间,长沙畅想网络技术工作室广告收益 9167638.55 元,上海毓璃网络技术工作室广告收益 10863914.2 元,上海昶悠网络技术工作室广告收益 286828.46 元。肖某共获取广告推广费 2000 余万元。
法院观点
《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》第三条规定“网络用户、网络服务提供者未经许可,通过信息网络提供权利人享有信息网络传播权的作品、表演、录音录像制品,除法律、行政法规另有规定外,人民法院应当认定其构成侵害信息网络传播权行为。通过上传到网络服务器、设置共享文件或者利用文件分享软件等方式,将作品、表演、录音录像制品置于信息网络中,使公众能够在个人选定的时间和地点以下载、浏览或者其他方式获得的,人民法院应当认定其实施了前款规定的提供行为”。
本案中被告人肖某开发的“悦读免费小说” APP 中设置了爬虫程序从其他网站扒取小说书名、封面、网站链接等,并把小说链接、小说简介、小说名字等信息存储到其服务器里,并且进行了增减、排版和过滤,插入广告,读者可以六种方式通过“阅读免费小说” APP 进行阅读,其中“立即阅读”模式读者可以在该 APP 页面直接阅读小说,“全书缓存”模式可以下载小说供读者在选定的时间和地点阅读,“悦读免费小说”中扒取的小说均未经过著作权或其授权人的许可,侵害了著作权权利人的信息网络传播权。
被告人肖某辩护其服务器中并未存储小说,但存储了小说链接、小说简介、小说名字,虽然“悦读免费小说” APP 中确实有链接服务,但是其提供的不是普通链接服务,用户点击后并不直接跳转到第三方网页首页,而是直接在该 APP 中显示相关页面,被告人亦供述“悦读免费小说” APP 默认是全屏阅读,读者都是在 APP 的界面中进行阅读,在全屏阅读时分辨不出在哪个网站进行观看小说的,因为软件自动进行了转码阅读,只有读者自己退出全屏阅读点击菜单才能看到是在哪个网站看到的,也就是说读者完全感觉是在“悦读免费小说” APP 中进行阅读,而不是在其他网站进行阅读,故应当认定属于复制发行和传播行为。“悦读免费小说” APP 中扒取的小说经司法鉴定与被害人北京腾飞克科技有限公司享有著作权包括信息网络传播权的小说相似度大于70%的有 4519 部,因此被告人的行为构成侵犯著作权权利人信息网络传播权的行为。
法院认为,被告人肖俊以营利为目的,未经著作权权利人许可,擅自在其开发的“悦读免费小说” APP 中复制发行他人享有著作权权利的文字作品,其行为构成侵犯著作权罪。被告人肖俊非-法-经营数额达 2000 余万元,非法复制发行他人作品的数量众多,属于情节特别严重,依法应在三年以上十年以下有期徒刑幅度内量刑,并处罚金。
2021年12月24日,永丰县人民检察院以肖某犯侵犯著作权罪提起公诉。2022年8月15日,法院作出一审判决,以犯侵犯著作权罪,判处肖某有期徒刑五年,并处相应罚金。肖某不服判决,提出上诉。2022年10月25日,中级人民法院裁定驳回上诉,维持原判。
判决情况
-
被告人肖某犯侵犯著作权罪,判处有期徒刑五年,并处罚金人民币 100 万元;
-
追缴被告人肖某违法所得 20318381.21 元及其产生的收益,上缴国库;。
-
没收扣押在案的作案工具苹果 macbookpro 电脑一台。
判决文书
(2022)赣0825刑初2号
案例分析
根据案情介绍,肖某通过网络爬虫技术爬取电子小说信息,为用户提供直接阅读、下载功能,使公众可以在选定的时间和地点阅读,符合信息网络传播行为的实质性要件,侵犯了权利人的信息网络传播权,并依此获取了巨额的利益,这种行为明显是触犯了法律法规的。这种小说侵犯著作权案屡见不鲜,早在2011年,盛大文学就告了“小说5200”网站的侵权行为,后者的相关负责人最终也都被判刑了。在网络上爬取喜欢的小说,供自己或朋友阅读,见仁见智,但是切莫大量的爬取小说、文章等,然后借此获利,这是缺乏道德,且违反法律的行为。
通过爬虫侵犯著作权来获取作品并以盈利的方式使用,将著作权人的劳动成果无偿占为己有,对著作权人造成经济损失。同时,这种行为也扭曲了正常的市场竞争,给那些合法获得授权并按照规定使用作品的人带来不公平的竞争环境。一旦大众缺乏版权意识,都抱着白嫖的心理,使得盗版抄袭行为猖獗,形成一种恶性的市场环境,必然会打击原创者的积极性,好的作品将会越来越少。
随着网络技术的发展,通过信息网络向公众提供作品的获利方式不再局限于收取会员注册费或者作品下载费、阅读费等直接、传统的收益方式,而是逐渐转向收取第三方高额广告费等间接方式,利用海量用户在使用软件时的巨大广告点击量牟取暴利。这不失为一种好的策略,但切记提供的产品一定不能是侵权所得,不然获利再多,也迟早有吐出来的那一天,谁都想赚钱,不过一定要通过合法合规的渠道。
还是老话长谈,技术本身是无罪的,但谨记不要利用技术来实施可能违法犯罪的行为。不要心怀侥幸,若一直游走于刀尖,出事是迟早的事情,一定不要为一时的利益蒙蔽了双眼。在此劝谏各位爬虫工程师们,切莫触碰灰黑地带,越过了法律的红线!
这个程序员出版一本书,挣了100万,他是怎么做到的...
今天要给大家介绍一个我的朋友,他通过写书就挣到了100万。
1
相识于自媒体
关注我的朋友,应该有很多一部分人都知道,《程序员小灰》这个公众号吧,一方面我们经常相互推荐,另一方面也都 Java 出身。
其实最早的时候,我也不认识小灰。
2017年的时候,我开始做公众号,有朋友建了一个技术自媒体交流群,我和小灰刚好都在一个群里,那个时候我俩在自媒体领域都是小菜鸟。
于是有事没事的时候,经常在一起商量着怎么做好,后面又经常合作一起做一点事情,于是就这样熟了起来。
那个时候我还在北京,一般有事没事的时候,我们会因为出版社活动,或者是其它圈子活动,都相互喊一下一起参与。
就这样慢慢的从不认识,到熟悉,到成革命般的友谊 。
2
漫画算法
大家可能不知道,小灰最初是搞修理飞机的,我一次听说的时候也大吃一惊,真的是365行,行行转程序员。
后来是通过培训走进程序员这个行业,这个经历和我蛮类似的,到了后来在摩拜、京东做过几年程序员。
在做程序员的期间,他也比较喜欢捣鼓,于是做了一个程序员公众号,主要是以漫画小仓鼠的形式给大家讲技术。
文章风趣、幽默,易懂,受到很多技术人的欢迎,说实话就连我个人都非常喜欢他的文章风格。
5年时间,小灰在公众号积累了很多漫画算法的内容,后来就被出版社给盯上了,邀请他用漫画的形式出一本书籍。
让大家读故事的方式去学习算法、通俗易懂学习起来也很有趣。用了大概1年多的时间吧,小灰的书出版了。
3
爆款中的爆款
之前在我的星球和大家分享过,《技术人出版书籍赚不赚钱》,通过我的研究得出的结论。
技术人出版的书籍,一般收入在5-20万之间,并且大部分人集中在 10 万左右。
因为出版一本书的版税只有8%,技术书籍受众比较小,一般可以卖1万本都是畅销书了,所以出版书籍赚钱的性价比不是很高。
但,凡事都有特例,除过爆款!
2019年,小灰出版的书籍《漫画算法》,刚出版就登上2019最畅销的科技类新书TOP1.
当年,双十一的时候,还登上了北京公交站的广告牌。
面向港澳台读者,还出了繁体版。
突然让我想起了一句话:出场即是巅峰呀。
到目前为止,《漫画算法》的销量已经突破了70000册,这个销量在 IT 领域是爆款中的爆款了。
4
2又来了
《漫画算法》的内容定位是“入门级”,因此讲解的是相对基础的数据结构和算法知识,没有红黑树,没有B树,没有KMP算法。
于是,经过两年的酝酿,小灰的新书《漫画算法2》又出版了!
一周左右的时间里,小灰的图书再次登上了京东和当当图书销量榜的第一名,不用预测又是一本畅销书。
闭着眼睛预测一下,漫画算法系列书籍的版税肯定超过了100万!
《漫画算法2》不是第一本的升级版,恰恰相反,这本书是第一本的续集,两者在内容上完全没有重叠。
《漫画算法2》,都讲了些什么呢?
第一章 排序算法的进阶
介绍几种典型的排序算法,包括选择排序、插入排序、希尔排序、归并排序、基数排序。
第二章 树的进阶
介绍了树的高级应用,包括二叉查找树、AVL树、红黑树、B树、B+树。
第三章 图
介绍图这种数据结构,以及深度优先遍历、广度优先遍历、单源最短路径、多源最短路径算法。
第四章 查找
介绍“查找”相关的算法和数据结构,包括二分查找算法、RK算法、KMP算法、跳表。
第五章 面试中的算法
介绍了多种职场上流行的算法面试题目及详细的解题思路,例如螺旋遍历二维数组、寻找数组中第K大元素、求股票交易最大收益等。
5
送书20本
给大家看一下书中的截图:
这篇文章是给小灰友情推荐,不是广告什么的,而且这本书也确实值得去分享给大家。
当然我也不能完全免费给小灰推荐,我给大家要了一份福利,拿出20本书籍送给关注《纯洁的微笑》读者。
大家在这篇文章下留言,谈谈你读技术书籍的收获,或者读书的收获,我会从中抽取20位送出一本小灰最新出版的书籍。
当然了,我的知识星球用户、以前赞赏和留言比较多的用户,我会优先送书的,星球的朋友留言的时候可以带上ID,方便我核对。
对了,这本书籍我还写了推荐序,收到书籍的朋友会发现这个小彩蛋。
不想抽奖的朋友,可以直接扫下方二维码购买,这个是京东的5折优惠购买链接,也很实惠的。
以上是关于K哥爬虫普法一个人一年半挣了2000万!的主要内容,如果未能解决你的问题,请参考以下文章