马蜂窝“抄袭”事件持续发酵 UGC内容平台真实面貌待揭秘

钱玉娟2018-10-23 17:30

(图片来源:全景视觉)

经济观察网 记者 钱玉娟 实习记者 赵喆 还有5分钟就到凌晨十二点了,“战斗”了一天的梓泉还没休息,他通过微信告诉经济观察网记者,“今天接受了七家媒体采访,还在准备反击。”并跟记者约好了10月23日上午再进行对话。

10月20日、21日两晚里,微信公众号“小声比比”连发《估值 175 亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》和《马蜂窝开始毁灭证据了,但这水平真的哈哈哈哈哈哈哈哈》两篇文章,剑指百亿体量的旅游独角兽“马蜂窝”超过85%的点评为抄袭,被誉为“精华”的游记也被水军和机器人“玷污”,而成败取决于平台流量规模的UGC平台们的生存现状,也正被推至风口浪尖。

一“曝”成名

就在首篇“爆料”后,梓泉与乎睿数据仿佛一夜之间成了“明星”,广为谈及。此前,梓泉通过自创名为“小声比比”的微信公众号平台保持着对行业的持续关注,不时推出一些内容。经济观察网记者通过天眼查了解到,来自深圳的乎睿数据有限公司(下文简称“乎睿数据”),于2018年1月11日注册,包括法定代表人吴昊在内,团队共三人,在行业内查询该团队成员等,甚至可以用“籍籍无名”来形容。

据梓泉透露,文章的数据素材和相关分析来自乎睿数据,而他本人则作为文字编辑输出的一方,两方均未获得任何商业利益或收受商业贿赂。“我以及乎睿团队没有接受过任何OTA公司或者马蜂窝潜在竞争对手的商业赞助,连类似的广告都没有接过。”

经济观察网记者获悉,梓泉在文章中主要抨击了马蜂窝的三大痛点。首先,点评造假数超85%。乎睿数据统计发现马蜂窝平台有7454个抄袭账号,平均每人从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评,合计抄袭572万条餐饮点评、1221万条酒店点评,占到官网声称的2100万“真实点评”的85%。

其次,点评造假抄袭系机器人或内部员工幕后操作。梓泉在文中举例指出,官方账号“问答小班长10号”性别、位置自相矛盾;马蜂窝从海外网站抄袭的点评系直接用谷歌翻译而来,错误百出,甚至还连带粘贴了“简明英汉词典”的字样。

不仅如此,乎睿数据还将马蜂窝与大众点评进行比较,发现二者的数据趋势截然相反,且前者的点评数量会在特定时间节点指数级增长,随后出现断崖式回落,侧面反映着马蜂窝在外显数据漏洞之外的可疑增势。

其次,乎睿数据对马蜂窝平台上抄袭账号外的活跃用户进行选取分析,发现竟然存在1.5万用户存在“同步行动”,同时相对普通游记,平台上有7%的营销游记被“人为”操作,欺骗用户踩雷。

当然除了上述“爆料”,梓泉在其首篇文章的结尾对乎睿数据还进行了详尽介绍,“乎睿数据是一支致力于通过技术改善生活的年轻团队。成员毕业或就读于宾大、康奈尔、伊利诺伊香槟分校等高等院校,精通人工智能、自然语言处理、大数据分析等技术,曾在谷歌、脸书等一线企业任职,拥有丰富的研发与领导经验及多项专利,并曾于AAAI、NAACL、ACL等顶级学术会议发表论文。”

相对于爆料引发热议的喧嚣,十分讽刺的是,乎睿数据起初只是想通过马蜂窝“练手”,为团队做的分辨餐饮点评真实性的模型进行实际数据的机器训练,没想到揭出了“惊天丑闻”。

尽管经济观察网记者从天眼查中获得了乎睿数据的相关信息,但当记者欲通过梓泉来与吴昊等进行联络时,被告知“目前没有任何一家媒体能采访到乎睿数据,他们本身也不愿意接受采访。”

一纸诉状

在小声比比的两篇文章曝光后,马蜂窝在21日早晨发布官方声明,在对全站数据进行核查后,“点评内容在马蜂窝整体数据中仅占2.91%,虚假点评号在总体中的占比更是微乎其微”,其用户分享的主要载体是游记、攻略和问答,并称“这才是马蜂窝的真实价值所在”:其“平台UGC内容数据中,游记和攻略占比78.91%、嗡嗡(旅行故事)占比7.92%、问答占比10.26%”。

马蜂窝官方认为,文章所述的平台用户数量,与事实和第三方机构数据严重不符。并在第二篇文章发布后一纸诉状将梓泉及乎睿数据告上了法庭,强调其名誉受损。

经济观察网记者了解到,被腾讯收入麾下的马蜂窝,至今已与潜在投资者进行了为期数月的谈判,日前筹划着其新一轮高达3亿美元的融资。而梓泉及乎睿数据联合发布的文章对其进行的“僵尸水军”或“爬虫”等公开指控,几乎是“直指要害”。

一直以来,马蜂窝利用个性化推荐和点评等UGC内容区别于其他同业,且依靠这一模式保持着差异化运营。马蜂窝曾对外发布数据,“平台每月有1亿活跃用户,其中85%来自移动应用程序,网站用户每月发布超过13.5万篇游记分享等。”甚至,作为马蜂窝创始人的陈罡,还曾严词批判过2014年去哪儿网虚假评论造假一事。

“平台一直以来严厉打击游记和问题中违规广告的行为,平均每周处理26000条违规广告信息,查封15000个违规账号。”马蜂窝认为,梓泉和乎睿数据将不法商家的违规行为归结在它身上,“与事实严重不符”。

至今,对于“僵尸”和“水军”泛滥的诟病,马蜂窝依然据理力争,予以否认。而作为以往“有生活、有情怀”的旅游独角兽,此番深陷“抄袭”、“造假”声浪中,马蜂窝的神话会就此告终还是能打个翻身仗,尚有待进一步观察。

真实的UGC世界

经济观察网记者从梓泉的文章粉丝留言中也发现,有不少建议其继马蜂窝后继续扒一下类似的UGC内容平台,像抖音、小红书等。

对此,在互联网领域从业多年的互联网产品总监陈砾雷告诉经济观察网记者,互联网行业“爬虫”抓取、抄袭和“水军”造假的现象已经屡见不鲜,尤其在流量红利渐失,单纯靠平台用户活跃生产内容,形成规模量级的现实触顶,不少平台参与者会通过大量数据造假,抄袭同行内容,利用僵尸和水军打造“虚假”增势,吸引新用户,与同业竞争。

“制造规模流量假象,既是给用户看、商家看,更是给投资人看。”电子商务研究中心生活服务电商分析师陈礼腾对上述平台造假的目的进一步分析指出,不少UGC内容为主的平台在抓取内容数据时,并不涉及数据库门槛,技术上毫无难度,通常是“机器抓取+人工编辑”。

他还指出了像58同城抄袭韩国招聘网站等事件,更深层次的表明爬虫抓取、抄袭和造假等行为,甚至成为了一些平台“屡试不爽”的“捷径”。

在马蜂窝事件爆发后,经济观察网第一时间和小红书方面取得了联系,其公关负责人袁珊珊告诉记者,“尽管我们不止一次受到其他平台的恶劣抄袭,但我们可以明确的是,从未主动做过任何类似的搬运、抄袭等作弊行为。”她还表示,在小红书长期的“反扒”过程中,也保留了各种证据,同时呼吁对于UGC内容平台的真实面貌加以剖析,从而能进一步规范相关行业平台展开良性竞争,绿色发展。

在23日上午接受经济观察网记者采访的过程中,梓泉面对马蜂窝的法律诉讼表示难以理解,“如果马蜂窝认为我们的算法有问题,欢迎他们质疑我们的统计口径,以及验算方法,也希望他们公布自己的统计口径和验算方法。”同时,“(马蜂窝)一味地质疑我们的动机,给我们扣帽子,泼脏水(的行为)”,梓泉强调,“我会在公众号坚持原有路线。”

而针对已经从双方对峙上升至法律诉讼层面的马蜂窝“抄袭”事件,上海创远律师事务所高级合伙人许峰抛开自己的律师身份,单从读者的角度认为,从当前的事件发展来看,梓泉和乎睿数据的一系列数据取证留存和表述都占据优势,倒是马蜂窝平台后来进行了相关数据清理,后又展开否定多少缺乏底气。

“这已经不是头一次出现,不少网站都出现过类似的情况。”许峰从法律的角度强调,这一事件亟需市场规范举措的推行,”毕竟对消费者而言,具有很大的误导性。”他告诉记者,虽然内容在哪里都一样,但因不少网站自身会有销售层面的内容,后期会形成购买相关产品的交易行为,因此内容便具备了归属和版权等价值。

陈礼腾在接受经济观察网记者采访的过程中表示,“这种’杀鸡取卵式’的手段不值得提倡。”他分析指出,像马蜂窝这样已经成长为行业头部的平台型企业,采用抓取来吸引用户和流量,多为入驻平台的商家所为的可能性较大。

许峰指出,一系列事件都对平台型企业间如何展开公平竞争提出了更多要求,平台往往需要投入大量的人力物力,通过思考积极有效的运营策略,吸引用户增强活跃度,保持平台的平稳发展,杜绝抄袭造假等不正当竞争行为。  

TMT新闻部记者
长期关注并报道TMT领域的重大事件,时刻保持新闻敏感,发现前沿趋势。擅长企业模式、人物专访及行业深度报道。
重要新闻线索可联系qianyujuan@eeo.com.cn。