看到一篇文章《马斯克败诉:法院认为第三方抓取X/Twitter平台数据并没有违法》,感觉挺遗憾的,我认为在X平台已经明确拒绝的情况下,第三方(Bright Data)仍然抓取X平台数据的做法是不道德的。
如果说平台本身不拥有数据,那么平台是否还有保密、保护等义务?例如你在A站创作的内容,被某人窃取发布者B站,那么A站有没有义务帮助你去B站维权?这就是著作权问题,特别是声明了“不得转发”的内容。 第三方(Bright Data)抓取数据时,极有可能也抓取了声明“不得转发”的内容。既然平台本身不拥有数据,那么去对抗平台级的抄袭者,只能靠身单力薄的作者个人了。
我国没有避风港原则,平台需要负责管控着用户的一言一行。所以我们有时莫名其妙的……啊不,依据有关部门的法律法规和公关部门的通知,被删帖、被限流、被禁言。我转发的一些微博,收藏的视频,不知道何时就被删了,我甚至不知道被删的是啥,更别说理由了!当然,理由也不需要告诉我,为啥被删心里还是有点儿数的……他们知道我知道,我知道他们知道我知道,一切尽在不言中。
问题在于,这些数据是否属于公开数据?由于任何人都可以查看平台上的内容,因此客观事实上确实属于公开的。但对于平台上的一些用户而言,他们认为的公开可能仅限于此平台,仅限于这个“圈子”里,并不希望被其它平台的用户来打扰。你也不想被个别别有用心的人,将内容截图发布到其它平台上说“原来这个人在那里说这种嘴脸”。当然,由于客观上平台的公开,是否不被打扰也只能寄希望于他人的素质了,显然Bright Data不具备。
法院认为如果禁止抓这些公开数据会造成影响公共利益的信息垄断,那么该平台当前是否具有垄断地位?国际上与X类似的平台还有Facebook、Threads等,不像我国实际只剩新浪微博一家。另外,具有垄断地位的平台是否有义务为其它平台提供免费服务?“爬虫”软件对平台的资源消耗远大于真人用户,而且对被爬取的平台没有任何好处。
我觉得法院应当支持“违反使用条款”这个说法。多数平台是只允许真人访问;或者只允许非商业使用;或者允许“爬虫”软件抓取部分公开数据,而不是抓取所有数据。Bright Data肯定知道这些江湖规矩,但不遵守。类似的还有一些公司使用开源代码,却不遵守开源协议(GPL)的事。反正我在普通用户眼里是有头有脸的,这种下三滥的专业事他们也不懂。主打的就是你能把我怎么样,不信你瞧法院也支持我。