4月16日,据抖音集团微信公众号,在昨日的抖音安全与信任中心开放日活动上,抖音相关业务负责人基于网站版块,就社会关切的算法和治理问题展开介绍。
据介绍,抖音推荐算法核心目标是通过分析用户的“行为”(点击、浏览、喜欢、转发、收藏等),构建个性化的推荐模型。系统会基于用户历史动作、对象特征和上下文环境,采用算法模型,预测用户可能会对什么样的内容产生什么样的行为。
抖音算法已几乎不依赖对内容和用户打标签,而是通过神经网络计算,预估用户行为,计算用户观看这条内容获得的价值总和,把排名靠前的内容推给用户。
在抖音的实际应用中,推荐系统采取“人工 + 机器”协同的方式进行风险治理,始终有人工运营和治理体系为算法导航;多目标体系算法能主动打破“信息茧房”,为用户带来更丰富多元、实用可靠的推荐结果。
抖音应用的深度学习算法包括Wide&Deep模型、双塔召回模型等。前者可解决协同过滤算法容易造成信息单一、泛化不足的问题,后者在召回环节提供更好的推荐效果。
基于人工智能机器学习和深度学习构建的推荐算法,其本质是数学模型的运算过程,只是在建立用户行为与内容特征之间的数学统计关联,而非理解内容本身。抖音推荐算法的核心逻辑可以简化为“推荐优先级公式”:综合预测用户行为概率×行为价值权重 = 视频推荐优先级。
模型需要内容和用户两端的数据做输入,其中主要是学习用户行为数据。结合用户行为和视频本身的价值权重,推算出视频推荐的价值分数,并将综合得出的价值最高的视频推送给用户。
官方表示,抖音的价值模型希望实现内容、用户、作者以及平台的多方价值共赢,并通过不断调整参数,对各类价值进行加权。随着算法的进步,抖音已经实现了“分钟级”实时反馈更新。
抖音表示,推荐算法通过各种“目标”来预估用户行为。推荐算法诞生之初,只关注单一或者少量的目标。随着抖音的用户愈发多样化,内容风格也日益多元,平台上有了越来越多的优质中长视频,完播率等少数目标难以满足需求,多目标建模成为技术上的自然选择。
抖音方面称,已经发展出非常复杂的多目标体系,比如将收藏率纳入多目标,帮助知识类内容推送给有需求的用户;增强“收藏+复访”“关注+追更”“打开+搜索”等组合目标,预估用户长期行为,帮助用户探索长期需求;设置探索类指标,帮助用户探索可能他们自己都还没发现的潜在需求,助力破除“信息茧房”;设置原创性目标,鼓励优质、新颖且具有独特价值的内容推荐。
此外,抖音集团还表示,平台治理存在于内容发布与传播的每一个环节,整体遵循两个原则。一是所有在平台发布的内容都会经过评估,流量越高的内容经过评估的次数越多,标准也越严格;二是“人工+机器”审核相互分工又密切配合。
一条视频可能触发多个治理研判节点,视频被举报、评论区出现集中质疑、流量激增等情况,均可能触发“人工+机器”审核。而在任一环节,一旦内容被处置,基本都会立即停止进一步的推荐和分发。
针对社会普遍关心的、呈现聚集特征的、反复出现的、对用户造成较多困扰的焦点问题,抖音成立了数个专项治理团队,分别设置相应的治理标准、识别策略、处置手段和风险巡查能力,专注应对涉及特殊群体、网络暴力、AIGC技术滥用等问题治理。
据悉,3月30日,“抖音安全与信任中心”网站上线,网站面向社会首次公开抖音算法原理、社区规范、治理体系和用户服务机制。
