继2017年3月宣布取消新闻源库后,百度新闻在2023年年中迎来了历史上最大规模的新闻收录展示调整,堪称史诗级。
本轮调整中,新浪、腾讯、搜狐、网易、凤凰五大门户网站的内容在百度新闻搜索结果中大量消失,包括新闻机构的内容,以及商业资讯机构、自媒体的内容;部分非新闻机构主办的资讯网站的内容不再予以展示,予以展示的也出现可查阅内容缩水情况,例如36Kr、钛媒体、虎嗅网等。
新闻机构主办的网站也受到波及,包括新华社、人民日报、光明日报、中新社等18家中央主要新闻单位主办的网站,以及澎湃新闻、界面新闻等一众知名媒体在内,大量内容均在百度新闻搜索结果中消失。
从用户角度,在使用百度新闻搜索服务时会发现,可查看内容大量萎缩,以百度关键词为例,搜索时仅出现51条相关链接(测试日期为8月14日),而以往则有数以万计的内容可被搜索。在这极其有限的搜索结果中,实时新闻仅占小部分,多数为历史新闻,搜索结果页第一页中甚至出现2018年的新闻报道。
不仅如此,百度旗下自媒体平台“百家号”中个人作者的内容亦从搜索结果中消失,目前会出现在百度新闻搜索结果中的百家号内容,几乎都来自百家号鲲鹏计划获奖作者。
事实上,今年6月初,百度新闻针对内容收录展示的调整就可以被用户和内容生产方察觉。这一情况也引发了站长圈和媒体公关圈小范围的关注。6月底,某商业资讯网站负责人就曾向笔者反映称,该网站被百度新闻停止收录展示。后经了解,该网站委托相关他人与百度沟通恢复未果。
百度新闻此番新闻收录展示的大调整,将直接影响诸多新闻与资讯网站的流量,尤其是中小型网站;对用户而言,可搜索的内容极度萎缩,获取信息的需求变得难以满足。
百度新闻相关工作人员未透露调整的原因。笔者认为,这或许与中央网信办开展的2023年“清朗”系列专项治理行动有关,尤其是“清朗·从严整治’自媒体’乱象”专项行动,但原因似乎不止于此。
笔者试图通过以下分析厘清百度新闻目前的现状和未来变化的可能性 。
1 百度新闻发展进程
1.1 从网站到APP
百度新闻搜索诞生于2003年,它的核心价值简单明了,满足用户检索新闻资讯和媒体通过搜索渠道传播新闻资讯的需求,提供的是长尾流量。
和互联网从PC到移动端一样,时代在变化,百度新闻也在变化。
1.0阶段,百度新闻只有网站;2.0阶段,百度APP(原手百)诞生,新闻搜索是里面的主要服务之一,百度新闻也拥有了自己的APP。
很长一段时间里,百度新闻收录的内容都源自传统新闻单位开设的新闻网站,以及政务门户网站的新闻频道、综合门户网站、垂直资讯网站(企业站和个人站,符合内容要求的均可入选)。
1.2 进入自媒体时代
3.0阶段,百度新闻引入了自媒体内容,虎嗅网、钛媒体、36kr等拥有优质自媒体内容的外部平台进入新闻源库,五大门户的自媒体内容也一度入选;百度推出自己的自媒体平台,早期叫百度百家,后来升级更名为百家号,同样进入新闻源库。
1.3 取消百度新闻源
2017年3月21日,百度宣布取消百度新闻源,原新闻源库中的最优质站点被邀请加入百度站长平台VIP俱乐部,给予优质内容更多展示。
通俗地讲,充斥低质量新闻资讯内容的网站会被百度新闻取消收录,有高质量内容的网站则可以继续出现在百度新闻的信息流以及搜索结果之中,只是名义上的身份出现了变化。
期间,受到波及的主要是大型媒体网站的“垃圾频道”,原创能力不足、价值性低的新闻资讯网站(含个人和企业主办),还有部分小型新闻单位举办的网站。
这一变化导致部分网站不再受到公关人员的重视,投放缩减,主要波及中小型垂类资讯网站。公关人员开始逐渐不以内容是否被百度新闻收录作为一项重要业绩指标,媒体上有内容发布,有展示位置即可,如果有收录更好,媒体的百家号有二次发布,好上加好。
1.4 调整内容库,史上最强力度
4.0阶段,也就是现在,百度再次大刀阔斧的改革新闻搜索的内容端。
进入2023年6月,百度新闻启用了新的内容收录规则,但没有对外界公布规则详情和启用新规则的原因。
2 史诗级大调整
2.1 有违搜索引擎的核心价值
本次调整,是百度新闻历史上除了引入自媒体内容外,最大幅度的内容库调整,波及面甚广,这多少有违互联网的开放精神、搜索引擎的核心价值。
其次是,展示的内容太有限,很多历史内容无法搜到。关于可检索历史内容太有限,急需百度公众沟通部或者百度新闻业务部门出面回复。
2.2 五大门户
保持对网站站内内容的收录,基本停止网站站内内容的展示。
规则上近乎于一刀切,涉及了来自综合新闻频道以及财经、时政、科技等主要一级新闻频道,以及子站类一级频道下设的二级频道的内容;仅少量频道的内容被保留展示,但收录与展示范围极其有限,例如新浪广东、新浪城市。
五大门户网站站内的自媒体内容被取消收录,机器及人工转载的新闻机构内容被选择性收录,展示频率极大幅度大降,从展示结果上看没有逻辑可循。
观察分析:
五大门户内容采用了两种链接结构,即频道+编号和主域名+编号,前者多为系统转载或平台自产并人工发布内容,后者均为新闻媒体或自媒体以自媒体账号形式发布的内容。
自媒体高速且无序发展,致使五大门户充斥了大量的垃圾内容,其权威性大降,极其严重地降低用户体验,另一方面,某些门户中,甚至没有做链接结构、来源与署名的区分,百度甄别内容的难度提高到无法区分。
收录是收录,展示是展示,收录不意味着在搜索结果中展示。初步判断是,百度不可能彻底停止对五大门户内容的收录与展示,更倾向于认为百度后台有收录,但正在研究合理的展示方式,并且与平台保持沟通中。
2.3 商业新闻资讯网站
自媒体内容较多或仅有的,绝大多数被停止收录;仅有部分网站被保留收录,例如虎嗅网、钛媒体、36氪、ZAKER这类知名度较高的,但展示频率大降。
无自媒体内容的,保持收录,提供展示,展示频率大降。
自产内容及自媒体内容,经百家号发布,提供展示,展示频率大降。
对内容质量、用户体验的要求进一步提高,更多网站被停止收录;初步认为99.99%不可能恢复,除非有极大幅度改善。
观察分析:
商业新闻资讯网站,主要分为企业经营与个人经营,这类网站的内容,收录展示频率均发生大幅度下降。
原因可能与内容质量差、权威性弱、更新频率低、页面移动适配差、广告劣质及广告展示不友好有关系;另外,由于存在大量自动采集情况,自动采集的内容重复率高,对于搜索引擎不友好。
个人认为,ZAKER的内容质量整体而言不高,能够被百度新闻保留收录与展示,可能与其采用了百度落地页有关系,这意味着流量被留在了百度平台内;另外,ZAKER股东包括官方媒体,公私合营的身份也可能是被保留的原因。至于其它渠道嘛,基本是从百度导流到自己网站,所以这一切值得玩味。
2.4 百家号
百度新闻停止收录和展示来自普通个人百家号的内容。
商业非新闻机构的百家号保持收录,被保留的主要是百家号鲲鹏计划获奖作者,不过展示优先级似乎略低于新闻机构百家号,优质领域作者目前未发现名列其中。
新闻机构的百家号保持收录,提供展示,展示结果上看,与新闻机构所设网站接近对半,处于平衡状态;内容方面,包含新闻机构出版物里的内容,新闻机构旗下新媒体号的内容。
五大门户都拥有百家号,通过百家号发布的内容保留收录,提供展示,展示频率大降;主要原因猜测为内容发布过程中人工干预成分较高,内容权威性、及时性、准确性有保障。
政务及非盈利事业单位百家号的内容保持收录和展示,从展示结果上看,频率低于新闻机构百家号,政务为主。
观察分析:
百度新闻针对百家号内容展示的排序应该是新闻机构百家号与政务机构百家号>五大门户百家号与商业资讯机构百家号。但需要注意,新闻机构百家号占据了主流,其它的百家号展示频率要低一些。
百家号对个人账号的限制,是可以非常理解和值得支持,因为权威性、真实性、及时性、可靠性等诸方面都几乎无法保障,即便是有保障的也是极少数,为了芝麻丢了西瓜不值当。
2.5 政务网站新闻频道
政务网站新闻频道页面保持收录,提供展示,展示频率要低于新闻机构所设网站。毕竟政务网站新闻频道的内容多数为转载,只有少数为首发;另外,政府发布的公文不应当列入在新闻资讯当中,这属于信息披露,公众也主要从新闻媒体或者政务网站的业务频道获取相关信息。
中国政府网在Site域名后的搜索结果并不多。据此,倾向于认为百度希望用户更多地以关键词进行搜索,这样精准。Site域名只能精准检索特定网站的全部链接,对于筛选信息没有任何帮助,只有链接统计意义。
2.6 什么在驱动百度做变化?
第一,内容安全。2023中央网信办开展“清朗”系列专项治理行动。
第二,用户体验。垃圾内容不只是危言耸听、造谣生事的,还有AI拼凑生成、传统软文广告。良好的用户体验是互联网产品之根基,哪怕法律不管平台也得管。
第三,生态繁荣。百度新闻的内容收录大调整,无法脱离百度APP整体流量分发体系;百家号内容主要依托百度APP信息流进行分发,而这个地方才是真正能给作者带来收入,驱动作者持续创作的地方。
第四,价值立场。百度新闻、百度APP首先为用户服务,其次是合作伙伴;公关是什么?是百度的用户,而且只是亿万用户当中的一小撮,属于芝麻。公关还是什么?是客户,芝麻也是肉,百度当然不会丢,但百度应该是认为有百度信息流就足够了。
第五,公平竞争。五大门户在新闻资讯角度,是百度的竞争对手,大家在信息流里对用户你争我抢,那么就在一个平等的战场里更合适,你做你的XX新闻,我做我的百度APP信息流。
第六,一视同仁。五大门户如今都被部分自媒体和不负责任新闻机构生产的“新黄色新闻”、旧闻新发、摘编拼凑、不实信息给污染,百度百家号也不例外。百度新闻搜索对百度自家自媒体平台都下狠手大幅度停止收录展示,这些平台自然也没有例外。
2.7 百度新闻的优缺点
笔者下载了一些新闻客户端,但日常除重要推送外基本不浏览,主要原因是大量低质量自媒体内容影响信息获取体验。
百度新闻APP和其它新闻客户端不同,这个产品目前只收录展示权威媒体的内容,最大程度上避免了垃圾新闻;但它的缺点也很明显,没有网页搜索里按照时间进行检索的功能,而且由于百度隐藏了大量早期收录的内容,检索的时候会发现似乎99.99%的历史内容都“消失”了。
这一点很令人遗憾,搜索体验极其不友好。有可能是百度为了引导用户主要在网页搜索里进行内容检索,毕竟百度新闻搜索里广告非常少,作为一个商业公司,得考虑利益问题。其实百度新闻里有小的品牌专区广告,投放客户不多,不排除是客户认为这里流量较少。
另外,百度新闻APP可能是目前全网唯一一个禁止用户截屏、录屏的新闻客户端,出发点应该是版权保护。以收费新闻内容著称的财新APP都没有限制用户截屏、录屏。
3 公关怎么办?
3.1 放弃对百度新闻内链接收录的执念
作为中国占据85%市场份额的搜索引擎,百度是长尾流量的代名词,在新闻网站/APP和报刊杂志、社交网络之外,百度是用户获取新闻信息的主要渠道,百度新闻首当其冲。
这也使得在很长一段时间里,中国公关人都非常关注宣传过程中产生的线上报道是否被百度新闻收录,是否被收录意味着所在单位能否在用户的新闻搜索行为中被曝光。
如今百度发生巨大的变化,不仅仅是百度新闻可以分发新闻。在百度中,新闻有四个分发渠道/方式,即百度APP首页信息流、百度APP搜索结果页资讯频道、百度新闻网站(News.baidu.com)、百度新闻APP。
对用户而言,获取实时新闻通过百度APP信息流、百度新闻网站、百度新闻APP均可实现,只有查找既往新闻的时候,新闻搜索的价值才被体现。
用户目前依赖网页搜索服务远大于新闻搜索服务,新闻搜索俨然成为了百度必要但不重要的业务。何况百度新闻从2017年3月取消新闻源到这次收录大调整,收录这个考核条件基本丧失基础。
公关们就不必执着于百度新闻是否收录展示新闻链接了。
3.2 重视渠道本身和百度信息流
渠道第一,搜索第二。
无论是官方还是商业媒体,基本以“出版物(如有)+网站+平台账号+独立APP”的方式进行运作,一条报道少说能覆盖20~30+的渠道,最后通过信息流和弹窗提示推送给大众。
人对于新闻的需求大,对信息的需求更大,对公关来说,掌握优质新闻推送渠道,就是掌握了主要流量。
在百度当中,新闻的流量也主要集中在信息流和网页搜索服务当中,焦点放在百度新闻收录上,远不如放在百度/百度新闻APP信息流的推送位置和推送人次上。
3.3 谁是最好的新闻渠道?
公关们眼中,媒体的级别大致是中央新闻单位(电视台、报刊、网站)>南方&沪上官媒≧门户网站≧头部垂直媒体及自媒体的逻辑。
在阅读量、受众、权威性等角度大家各有所长。
单论搜索引擎的价值,中央新闻网站、南方系和沪上系新闻网站最佳,它们的一级频道不会被百度新闻限制收录及搜索结果展示,只是多个媒体多个链接时只展示一条而已。在网页搜索上也是同理。
4 关于未来的猜想
4.1 被取消收录的可能回归?
新浪、腾讯、网易、搜狐、凤凰五大门户应该是可以回归到百度新闻搜索结果中,只要区隔好PUG(新闻单位)、PUGC(优质商业机构)、UGC(个人作者)内容。笔者不认为百度乐意和他们交恶。
百家号方面,针对优质机构作者(PUGC)的限制现在可能会放宽一点,毕竟多少也有一些不错的,一刀切很可惜;UGC内容方面,不会回归到百度新闻当中,创作者将注意力放在百度信息流即可。
新闻机构网站和商业资讯网站的内容展示,应该会有比较详细的规则出台并通过百度搜索资源平台VIP俱乐部向平台提供。
4.2 历史内容检索优化
百度新闻搜索现在的内容展示量太有限,除了对来源的限制,还有对历史内容的限制,工具上也不全。现在这种一搜两眼一抹黑的情况,势必要改善,不过个人认为百度并不太积极,提供精准检索功能的可能性不大,但一定程度恢复历史新闻的搜索展示可能性较大。
4.3 用户行为强化
PC端,用户使用百度新闻搜索的频率并不高,相反查看网站首页的频率更高;百度APP方面,新闻搜索为二级入口,百度一直在引导用户通过信息流和大搜索完成搜索和日常浏览需求,未来这种用户行为引导会不断强化。