相关新闻:
马斯克:推特说我泄露机器人样本量,违反保密协议
马斯克:目前没有证据表明推特虚假账号占比小于5%,最火的推文也只有2%日活用户点赞
新浪科技讯 北京时间5月16日早间消息,据报道,特斯拉CEO埃隆·马斯克收购Twitter(推特)的交易节外生枝。马斯克自己抽样调查了推特虚假账号比例,但其方法被专家评价太“愚蠢”。
当地时间上周五,他突然宣布让440亿美元收购推特的计划暂停,理由是要亲自研究推特平台上虚假和垃圾信息账号的比例。这一举动导致推特股价当天暴跌。
质疑推特数据
稍后,马斯克予以澄清,表示自己仍致力于收购推特,不过他依然强调了虚假账号问题带来的困扰。马斯克透露,他自己的团队会进行独立研究分析。对于推特在最近财报中公布的虚假账号数据,马斯克表示怀疑。
在公布第一季度财报时,推特管理层表示,在平台上的确存在一些虚假和垃圾信息账号,另外还有“合法牟利”的日活跃用户。
推特表示,公司对一批推特用户账号的样本进行了内部分析,在今年第一季度,公司估计虚假账号和垃圾信息账号占到日活用户的比例低于5%。
推特还承认,在过去三年时间里,公司对于平台活跃用户的数据高估了140万人到190万人。据介绍,2019年3月,推特曾经推出一个功能,可以让一个用户把不同的推特账号链接在一起,以便方便切换,但是这个功能犯了一个错误,即母账号进行的一些互动活动,导致所有的关联账号都被认定为日活跃用户。
有专家表示,马斯克接下来要采取的一些行动力度可能不够。
马斯克的统计方法
在推文中,马斯克介绍了自己的团队将如何确定推特上虚假账号、垃圾信息账号和重复账号的情况。
马斯克团队将随机抽样关注“推特公司官方账号”的100名粉丝,他邀请其他用户重复这一方法。马斯克进一步解释说,可以随便找一个拥有很多粉丝的推特账号,忽略前面的1000名粉丝,然后每隔10个粉丝挑出一个(作为统计样本),马斯克也表示愿意听取其他更好的研究方法。
马斯克还表示,之所以拿100人作为粉丝调查样本,是因为这是推特在财报中计算用户数量的单位。
马斯克表示,任何合理的随机抽样过程都是可以的,如果很多独立账号得出了有关虚假账号、垃圾信息账号和重复账号的类似比例,那么这可以反映出一个重要信息。
对于马斯克是否清楚描述了团队将要采用的统计方法,推特方面拒绝评论。
并非真正随机
Facebook平台的联合创始人Dustin Moskovitz也发表推文,加入到了这一问题讨论中。他表示,马斯克的统计方法并不是真正随机,使用的样本数太少,可能导致巨大偏差。
Moskovitz也表示,如果不相信推特团队抽取的样本,这本身也是问题。
美国科技公司“BotSentinel”的创始人兼首席执行官Christopher Bouzy表示,其公司分析,推特不真实的账号比例高达10%到15%,其中包括虚假账号、垃圾信息账号、重复账号、从事恶意活动的机器人账号,以及单一目的的仇恨账号(主要攻击和骚扰其他人),另外还有大量账号故意传播虚假信息。
BotSentinel的研究方法主要采取众包模式,该公司采用计算机软件和人工审查员联合的方式,来研究推特的不真实账号活动。目前,该公司监控了推特上250万个账号,主要是英文用户。
布奇还表示,根据相关内容话题的不同,推特上不真实账号的数字也会呈现高低变化。他自己公司的研究发现,在政治、加密货币、气候变化、新冠病毒等争议性话题上,不真实账号的数字高于其他非争议话题,比如养猫、折纸艺术等。
马斯克方法太“愚蠢”?
美国华盛顿大学的教授Carl T. Bergstrom表示,对于高达440亿美元的大型并购交易来说,拿出一个单一用户的100名粉丝来进行抽样调查,这并不是合格的尽职调查。
Bergstrom表示,相比于社交媒体研究人员进行的抽样数量,100个的样本小了几个数量级。马斯克自己的统计方法可能出现所谓“选择性偏差”的错误。
这位学者表示,没有任何理由来支持这个想法,即某个推特官方账号的粉丝,是推特平台用户的代表样本。也许机器人账号为了避免被发现,可能不会去关注官方账号,也许这些机器人账号会比人类账号更加热衷于关注他人,但是马斯克的抽样研究方法有些“愚蠢”。