3 月 13 日消息,目前研究人员可以免费访问和分析社交媒体平台上生成的大量数据。但推特计划以每月 4.2 万美元(当前约 29.1 万元人民币)的起价向用户收取平台数据访问费用。研究人员抱怨称,收费太高而且能访问的数据太少。
自 2006 年成立以来,社交媒体平台推特一直扮演着社交媒体领域重要特征的角色,其中的部分原因是很多媒体人在平台上发布各类信息,也是因为推特愿意向研究人员开放数据。学者们可以免费访问推特的应用程序编程接口(API),从而获取平台上的各种信息数据,这有助于他们了解整个网络世界都在谈论什么。
大量研究人员都使用过推特的 API。自 2020 年以来,已有超过 17500 篇学术论文是基于推特平台的数据进行分析,这也强化了推特所有者埃隆・马斯克(Elon Musk)长期以来所宣称的观点:推特平台是“事实上的城市广场”。
但是推特新规表明,大多数依赖 API 访问开展研究的学者和组织现将无法继续使用推特。
今年 2 月 2 日,马斯克宣布平台 API 访问将在一周内设置付费墙。一周后,他决定将这一措施的上线推迟到 2 月 13 日。结果因为推特遭遇宕机事件,这个最后期限也过去了。
但根据推特客户代表在今年 3 月初发给不少学术客户的一份文件,该公司现在计划就开发者平台向相关用户提供三个级别的企业包 (Enterprise Packages)。其中最便宜的 Small Package 每月需要支付 4.2 万美元,可以访问 5000 万条推文。更高的级别可以让研究人员或企业访问更多数据,分别为 1 亿条和 2 亿条推文,但每月的费用分别为 12.5 万美元和 21 万美元。很多免费使用现有推特 API 的用户都证实了这一消息,他们都收到来自推特公司的电子邮件,称新的定价计划将在几个月内生效。
iDRAMA 实验室成员、纽约宾汉姆顿大学助理教授杰里米・布莱克本 (Jeremy Blackburn) 说:“我不知道地球上是否有学者能负担得起每月 4.2 万美元的使用费用。”iDRAMA 实验室专门分析社交媒体上存在的不良内容。
对于最便宜推特企业包的订阅者来说,他们用于过滤数据而设置的应用程序实时跟踪 API 规则数量将被限制在 2.5 万条,而完整档案搜索 API 的查询量将被限制在 5 万条。研究人员可以通过账户活跃度 API 分析的推特账号数量将被限制在 5000 个,而且每分钟通过用户参与度 API 最多只能发起 20 个请求。
虽然推特企业包中的内容听起来像是网罗了一个庞大数据集,但实际可访问内容只占推特每月生成信息的 0.3% 左右,这意味着研究人员付费拿到的信息远远不能反映推特平台上的所有活动。相比之下,推特目前免费的 API 访问机制允许研究人员访问所有推文的 1%。
德国马克斯・普朗克软件系统研究所教员埃丽莎・M・雷德迈尔斯 (Elissa M. Redmiles) 说,新的价格令人难以接受。她说:“这可能超出了我所听说过的任何学术预算。”她补充说,这个价格会影响到任何有关社交媒体用户情绪的长期分析。雷德迈尔斯表示:“一个月的推特数据并不能真正达到研究目的。”
布法罗大学 (University of Buffalo) 助理教授肯尼思・约瑟夫 (Kenneth Joseph) 最近发表了一篇合作论文,内容是分析推特一天的活跃度。他说,新的定价措施实际上是扼杀了他的事业。“不论我通过哪种合理方式,一个月都掏不出 4.2 万美元,”约瑟夫说,“这完全破坏了我在这个领域从事研究的任何机会,而我大部分事业都是建立在这个领域。”
目前研究人员仍然可以通过现有的 API 协议访问推特数据,但他们担心这一协议可能随时会被终止。他们说,新的成本“对学术界来说是不可行的”。
“没人付得起那么多钱,”研究人员们说。“即使是再富有的机构也负担不起每年 50 万美元购买少量数据的费用。”
目前还不清楚推特新的定价模式针对哪些用户。以色列本-古里安大学 (Ben-Gurion University) 软件与信息系统工程系助理教授尼尔・格林伯格 (Nir Grinberg) 曾在一家使用推特数据的初创公司工作。
“对于访问少量数据的用户来说,这种增长幅度太大了。几个月前,推特有 1% 的内容是能免费访问的。现在推特只提供 0.3% 的数据,前提还是每年掏 50 万美元。”格林伯格说,“这太疯狂了。说实话,我不知道谁能为此留出预算。”
研究人员们表示,损害不仅仅是学术研究。推特也是一个重要的数据集,可以帮助人们理解互联网是如何运作的,以及平台上正在进行哪些对话。
约瑟夫承认,他也可以研究其他社交媒体平台。但他说,推特平台上有媒体记者、高级官员和商业决策者,这使得其成为一个重要的研究领域。“推特是理解精英话语的一个特别平台,”他说。“对我们所有试图利用这个系统来解读世界的人来说,这是一颗难以下咽的药丸。”
然而布莱克本表示,研究人员会继续寻找一种方法来分析平台内容。他表示:“多年来,我们基本上与 Facebook 断绝了联系,但我们仍在继续取得研究进展。”“这个人为强迫所有用户读他的垃圾帖子,就在一个不赚钱的网站上烧了 440 亿美元。科学研究不会被这样的人所劫持。”