Python爬虫的法律边界(二)小爬怡情,大爬over!
数据抓取的门槛越来越低,会点程序,或使用网络工具都可以薅点数据,新入行了不少爬虫选手,但是对抓取使用数据的法律风险可能缺少认识。尤其是从去年的《网络安全法》实施开始,被新闻公开报道的相关法律诉讼已有好几起。 有人会争议互联网本质是鼓励分享,很多UGC的网站内容还是用户贡献的,网络公开数据应该都可以使用。 我也希望是这样,但现实不是这样。 所以 抓取数据前你最好看下被抓对象的知识产权申明 ,如果你是公司职员也关心下公司让你抓取数据的用途,多少了解下潜在风险。 以下是几个典型的爬虫选手爱光顾的网站知识产权申明。 经常抓点评数据的小哥们看下,上述是点评网的知识产权申明:用户发布的商店点评,评论,图片知识产权属于大众点评,未经许可,任何使用都是非法。 上述是微博的申明,未经书面许可,任何抓取微博内容都是非法抓取。爬虫老哥们有哪一个没抓过微博的? 上述是穷游网的知识产品申明,用户发布的旅游攻略所有权是穷游网的。 上述是比较典型的几个UGC网站,做点评的,做社交的,做攻略的。 创业公司数据冷启动时,有几个没有抓过他们家的数据? 这个潜在风险是存在的,就看你有没被对方顶上。 以下是几个法院判决案例: 大众点评诉讼百度地图非法使用点评数据,百度败诉,赔钱。 来自网易新闻 酷米客状告车来了非法抓取他家的公交信息,车来了败诉,车来了老板被三年刑期缓刑。 来自金融界百家号 新三板上市公司“数据堂”