《标签治理之标签评分及应用.docx》由会员分享,可在线阅读,更多相关《标签治理之标签评分及应用.docx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、标签治理之标签评分及应用前言:2一、为何要使用标签评分2二、标签评分模型22. 1标签使用度评分32. 2标签关注度评分42. 3标签质量评分 52. 4持续优化度评分52. 5安全度评分6三、标签评分的应用73. 1热门标签排行榜73. 2沉默标签排行榜83. 3综合排行榜93. 4标签使用度、关注度、持续优化度、质量、安全分榜单排行.108.58.37.37.0念综合排行查看更多详情 openlD常用手机号持仓最高的板块test0705025 分红次数7.06 持仓最高的基金6.97 当前持有卡数量6.98 短线交易收益6.99 持有投入金额6.810 星座6.73. 4标签使用度、关注度
2、、持续优化度、质量、安全分榜单排行用户可根据自己更加关注的维度,查看标签使用度、关注度、持续优化 度、质量、安全各个子维度的排行榜。同时,可查看各个标签的具体指标,如 使用度维度,可查看各个标签的当前引用次数、分析次数、调用次数,针对具体指标具体分析,满足不同的标签分析场景。口使用度捧行R关注度排行 犀捋续优化排行国质量排行防安全排行H isribb修、 arli .授案标签开始日期taxa*a当当月全年|历史以来 GSM梅名标H名弊使用度谆分:自BBI用次匕:分析次H用次数:1星座 8.044602所来潭 7.824903冲 Q 7.8210104帽合标张嘉试 7.824005带仓“的侬 7
3、.821806年抬:7.825507机投入金9 7.72608M开户时年妃 7.514509常用手机号 7.51100标签评分模型上线后,我们需要根据实际情况调整不同维度的权重,符 合自身实际情况。当经过一段时间的应用,大家认可这套评估逻辑之后,便 可以将静态化的评分展示转化为动态化的告警、自动化治理等,可设置标签 质量告警、评分告警,自动通知标签管理员、责任人等。前言:标签评分是标签治理的一个重要措施,通过给标签打分,可清晰直观的从各 个维度评估标签,掌握标签真实使用情况,进行标签持续优化,助力业务运营。 同时,也能帮助数据团队判断哪些标签更应该投入计算与存储资源,合理规划集 群资源。一、为
4、何要使用标签评分经过前期标签体系设计、标签加工,标签终于可以上线,让业务人员使 用,发挥价值了!随着标签上线一段时间后,我们开始关心每天占用计算资源与存储空间, 跑出来的上百个标签,业务同学真的用到了多少,业务收益是否能覆盖数据 成本呢?标签上线后,其质量怎么样,是否存在老规则不适用、需要持续优 化的情况?带着这一问题,我们需要用一种方法来评估标签上线后的使用情况,标 识各个标签的价值。参考电影评分、花呗评分等形式,我们决定也给标签打 个分、排个序,简单明了。二、标签评分模型标签评分模型,经过考虑我们选取了 5个维度作为评分入参:标签使用度标签关注度标签评分一 标签质量标签持续优化度标签安全度
5、标签总评分二a *标签使用度评分+ b *标签关注度评分+ c *标签质量评分+ d *标签持续优化度评分+ e *标签安全度评分其中标签使用度、标签关注度、标签质量、标签持续优化度作为核心维 度,标签安全度可根据实际情况考虑是否纳入。a、b、c、d、e是权重,总 和为100%o1 .1标签使用度评分标签使用度,用以评估标签被分析、外部系统的使用情况。标签有这几种使用场景:(1)标签引用:如原子标签被衍生标签应用、衍生标签被组合标签引用 等,基于该场景,计算“标签引用次数”指标。(2)标签分析:标签在标签圈群、群组画像、群组对比、显著性分析等画 像分析功能中被分析的情况,计算”标签分析次数”指
6、标。(3)标签调用:标签通过数据API被外部应用查询的次数,计算“标签调 用次数”指标。基于以上3个指标,我们首先采用Sigmoid函数将指标转化为评分,再将 各个指标的评分加权汇总成标签使用度评分。加权汇总总评分r使用度分析。一7.0标签调用越转4标签引用次取( 0标签分析次数)7Q 标签调用次数0近3。天e 标签调用分布0.90.60JIfi 无0 , OO O O O o0 O O 2022-08-M2022-08-192022-08-242022-08-292022-09-032022-09-082 . 2标签关注度评分标签关注度,用以评估被搜索、查看、收藏的情况。标签关注度与以下场景
7、有关:(1)标签搜索:标签在标签市场被用户搜索的情况,计算”标签搜索次 数”指标。(2)标签查看:标签被点击查看基础信息、分析页面等的次数,计算“标 签查看次数”指标。(3)标签收藏:收藏该标签的用户数,计算“收藏用户数”指标。以上3个指标可反映标签的关注热度,我们依然采用Sigmoid函数将指标 转化为评分,再将各个指标的评分加权汇总成标签关注度评分。关注度分析 46.8搜索次数0浏览次数收黠次数A302.3 标签质量评分标签质量,用以评估用户被打标情况,反映标签规则的合理性。当我们定义了标签和标签值,经过计算之后,标签值打在用户身上的很 少,那说明我们的规则执行不合理。比如我们定义了 “活
8、跃度”这个标签,分 为“高活跃、中活跃、低活跃度”等,但真实被打上的这个标签的用户,低于 70%,还有很大一部分比例是空值,未打上该标签,说明我们制定的标签值规则 有漏洞,需要完善。系统将计算每个标签的“标签覆盖度”,将覆盖度归一化为分数,转化成 评分。必惊签值率100.00%近30天标签值H情况标拶实例数lllllllllllllllllllllllllllllll2022-08-02022-08-202022-06-232022-08-262022-08-292022-09-042022-09-072022YW-K2.4 持续优化度评分持续优化度,用以评估标签上线后,是否后续再去优化该标签
9、。在客户的生命周期中,不断有新用户流入、沉默用户流失;公司战略调 整、产品发布等都会影响客户行为,这些变化我们需要以数据的方式呈现,所 以我们需要不断根据业务调整、客户变化调整我们的标签策略,以追求可通过 标签直接地、迅速地反映客户情况,指导业务运营。持续优化度,我们通过“标签优化次数”指标来评估,指标签上线后标签 被编辑再次发布的次数。我们同样采用Sigmoid函数将指标转化为评分。持续优化分析7.3优化次数12.5 安全度评分标签安全度,不能反映标签的热度,但也将其作为了标签评分的一个维度,可根据企业情况考虑是否纳入。标签安全相关的策略有:(1)标签的可见度:标签可编辑、可查看的用户范围。
10、(2)标签使用是否需要申请授权:标签发布后,其他人使用该标签,是否 需要申请审批。(3)标签是否进行行级权限控制:上面我们控制了标签的列权限,行级权 限反映该标签是否设置了行级权限。(4)标签是否脱敏:标签是否进行脱敏。根据标签的安全度策略配置情况,我们也采用评分的方式来评估。可见wn安全分析 +1.0是否脱n是否设行级权限。否否基于以上5个维度的评分,我们根据前面提的公式加权汇总,得到总评分。综管评分7.0使用度安全持续优化关注度三、标签评分的应用基于标签评分,为了更加直观的让标签管理员、业务人员查看热门标签、 沉默标签等,通过排行榜的方式呈现。3.1热门标签排行榜基于标签的使用度、关注度、
11、持续优化度3个角度来计算标签的热门评 分,展示TOP n的热门标签。壹看更多详情openlD8.5b热门排行openlD8.56常用手机号8.36test0705027.94 短线交易收益7.75 test27.66 持仓最高的板块7.67 持有投入金额7.18 当前持有卡数量7.19 组合标签测试7.110 分红次数7.0热门标签说明这些标签被经常使用,我们需要持续关注这些标签的正常 运行、质量,保障业务使用。3. 2沉默标签排行榜热门的标签的反向排序便是沉默标签,沉默标签说明这些标签使用率很低,可考虑定期下线,节省集群资源。iii沉默排行a查看更多详情*,火象星座34.3Q近一月买入金额区间4.3Q水象星座34.34 盈亏情绪4.35 testl4.36 客户僖息4.37 近三个月赎回次数4.38 黑色名单4.39 总收益率4.310 累计定投金额4.33. 3综合排行榜综合排行榜便根据标签的综合评分进行排序,从标签使用度、关注度、持续优化度、质量、安全等几个维度评估,全面评估标签。
限制150内