今天分享内容主要介绍了小红书是如何发掘和推荐每一篇热门笔记的。我了一下并分享给大家。
是关于笔记的分发和推荐方式。小红书的推荐算法考虑了许多因素,其中没有一个标准的公式可以概括。具体来说,推荐算法综合考虑了点击量、观看时长、完播率、下滑率、笔记质量、点赞量、收藏量、关注量、转发量以及评论数等因素。
针对消费、互动和体验类指标,小红书综合考虑了用户的消费行为偏好,并实现了个性化的权重组合。
举个例子,对于日常分享类的笔记,更注重点赞量;而工具类笔记更注重收藏量;求助类笔记则更注重评论数。
是关于推荐系统如何挖掘长尾内容并高效分发的问题。
小红书团队创造性地构建了一套内容质量框架,通过利用封面图片的美学模型和多模态笔记质量分模型,定义了有用和美好的内容。
技术团队借助大规模多模态预训练模型,并通过将笔记封面图和标题对应的方式获取训练样本,实现了对复杂多模态内容的综合语义表征。
团队利用内容的后验分发数据(例如点击率、点赞率、快划率等),微调了预训练向量,从而实现了对内容分发质量的级别预测。
再来看新笔记如何进行冷启动,以及如何识别种子人群。
小红书发现,扶持新发布、低曝光的笔记可以增加作者的发布意愿。
一篇笔记的初始数据一般,只要它有价值,系统仍然会根据中长尾信号将其推荐给需要的用户,与发布时效无关。
在冷启动阶段,系统更注重高质量评论数量的挖掘,以识别高潜力的笔记。因为高质量评论数量反映了目标人群对新内容的互动情况,也即新内容是否被准确地分发给符合其特性的人群。
一下:
小红书算法对普通用户的笔记更友好,容易产生“素帖爆火”的现象。
笔记的生命周期可以很长,并不受时间影响。如果一篇笔记的周期时间很短,那可能是因为没有布局关键词,或者涉及的关键词没有搜索量。
相比点赞数,高热互动对笔记是否被更多次分发有更大影响。