第三方抓取X平台数据没有违法，但肯定是不道德的

看到一篇文章《马斯克败诉：法院认为第三方抓取X/Twitter平台数据并没有违法》，感觉挺遗憾的，我认为在X平台已经明确拒绝的情况下，第三方（Bright Data）仍然抓取X平台数据的做法是不道德的。

法院在审理过程中强调了一个关键问题：社交网络实际上是不拥有用户数据的，因为社交网络平台不能一方面享受避风港原则带来的好处，一方面又强调数据属于自己。

如果说平台本身不拥有数据，那么平台是否还有保密、保护等义务？例如你在A站创作的内容，被某人窃取发布者B站，那么A站有没有义务帮助你去B站维权？这就是著作权问题，特别是声明了“不得转发”的内容。第三方（Bright Data）抓取数据时，极有可能也抓取了声明“不得转发”的内容。既然平台本身不拥有数据，那么去对抗平台级的抄袭者，只能靠身单力薄的作者个人了。

我国没有避风港原则，平台需要负责管控着用户的一言一行。所以我们有时莫名其妙的……啊不，依据有关部门的法律法规和公关部门的通知，被删帖、被限流、被禁言。我转发的一些微博，收藏的视频，不知道何时就被删了，我甚至不知道被删的是啥，更别说理由了！当然，理由也不需要告诉我，为啥被删心里还是有点儿数的……他们知道我知道，我知道他们知道我知道，一切尽在不言中。

在这起案例中，法院认为 X/Twitter 可能会造成影响公共利益的信息垄断，即该平台本身不拥有数据而是通过其他方式向用户提供公开的数据，因此 Bright Data 抓取这些公开数据自然不算是违法行为。

问题在于，这些数据是否属于公开数据？由于任何人都可以查看平台上的内容，因此客观事实上确实属于公开的。但对于平台上的一些用户而言，他们认为的公开可能仅限于此平台，仅限于这个“圈子”里，并不希望被其它平台的用户来打扰。你也不想被个别别有用心的人，将内容截图发布到其它平台上说“原来这个人在那里说这种嘴脸”。当然，由于客观上平台的公开，是否不被打扰也只能寄希望于他人的素质了，显然Bright Data不具备。

法院认为如果禁止抓这些公开数据会造成影响公共利益的信息垄断，那么该平台当前是否具有垄断地位？国际上与X类似的平台还有Facebook、Threads等，不像我国实际只剩新浪微博一家。另外，具有垄断地位的平台是否有义务为其它平台提供免费服务？“爬虫”软件对平台的资源消耗远大于真人用户，而且对被爬取的平台没有任何好处。

对于 X 认为 Bright Data 抓取数据、销售数据抓取工具是欺诈、违反使用条款、非法侵入和欺诈的说法，法院同样不认同，法院认定 X 试图对用户信息主张版权的行为不符合法律。

我觉得法院应当支持“违反使用条款”这个说法。多数平台是只允许真人访问；或者只允许非商业使用；或者允许“爬虫”软件抓取部分公开数据，而不是抓取所有数据。Bright Data肯定知道这些江湖规矩，但不遵守。类似的还有一些公司使用开源代码，却不遵守开源协议（GPL）的事。反正我在普通用户眼里是有头有脸的，这种下三滥的专业事他们也不懂。主打的就是你能把我怎么样，不信你瞧法院也支持我。

阅读数： 4

留下评论取消回复