pepnet:通过注入个性化的先验信息来训练参数化、嵌入化的个性化网络
创始人
2025-05-28 03:09:29

文章地址:https://arxiv.org/pdf/2302.01115.pdf

一、一些基础知识点

多任务、多场景

原文:Multi-task methods focus on fitting target distributions of different tasks, but ignore the semantic differences in the feature space under multi-domain settings. Multi-domain
methods focus on aligning the embedding distributions under different domains, but ignore dependencies in the label space under multi-task settings

翻译:多任务重点在拟合不同任务之间的分布,但是忽略了多领域(场景)下特征空间的不同点。多场景专注于对齐不同场景下的嵌入分布

双跷跷板现象

同一场景下的不同目标之间、不同场景下同一目标,样本稀疏程度、特征空间、用户分布等都是差异

思考如何传入先验知识

如果把这种先验知识放在最底层,那么在网络向上传播的过程中这种信息会变得非常弱,所以在哪里、怎么设计是很重要的一环

ppnet这边的网络,在反向梯度传播时。正常传播到ppnet这边的网络,但是不往主干网络传播,目的是不影响不影响主干网络。设计思想可能是:主干网络和ppnet网络层次分明、各干各的事,如果混在一起在快手这边可能效果不好。但是不一定在每个业务中都要这样,在有些业务中不加这个操作也是可以的,也能拿到正向收益

二、具体的论文解释看这篇文章讲得挺仔细的

「2023 | 快手」PEPNet:融合个性化先验信息的多场景多任务网络 - 知乎

快手牛亚男:基于多Domain多任务学习框架和Transformer,搭建快手精排模型

看文章中,特征有3部分

ppnet侧:从文章中能看出来是user、item、author相关的id类特征

中间主体:用户的各种统计、序列特征、实时、离线等;item的交叉特征;author的交叉特征也放在这里

左侧ep-net:场景相关的id类特征,统计特征等都可以放在这里

其他地方,都可以按照论文中的网络结构来做,也可以mmoe+ppnet+epnet来做。每个tower的N个mlp层乘不乘ppnet的输出都可以,如果只是ppnet的话,可以只乘到最底层的特征嵌入层 

相关内容

热门资讯

招标 | 近期隐私计算项目招标... 开放隐私计算 1招标1、江阴智慧港口公共服务平台项目名称:江阴智慧港口公共服务平台公告...
解决网页中Mixed Cont... 在Web开发中,作为开发者我们无可避免地需要引入资源文件,或者需要发起A...
redis cluster 集... master-slave -sentinel集群master 写单点,无法扩容。 ...
Java发起同步和异步HTTP... 同步与异步概念辨析 同步(synchronous)和异步(...
Kubernetes安装与集群... 一、环境准备 1、机器环境前置条件 当前演示准备3台虚拟机环境,或者是3台阿里云服务器...
simscape仿真总结2-机... 最近用simscape进行机器人的仿真,记录和总结一下学习心得和踩过的坑。 参照B站...
Redis(一):数据结构-底... 前言 从本文开始,我将分享一下近期自学 Redis 的学习笔记,其中大部...
flask教程5:abort函... 文章目录一、abort()函数的使用1.传递状态码信息2.传递响应体消息二、自定义错误处理 app....
【玩转Jetson TX2 N... 1 VMware14 Workstation Pro安装 如果没有Ubuntu系统电脑,...
2023还有人不知道kuber... 文章目录Kubernetes(K8s)一、Openstack&VM1、**认识虚拟化****1.1*...
NOI2019模拟赛 T1牛油... 题目描述 牛油果是一种神秘的水果,其具有一个坚固程度x≥0x\geq 0x≥0...
嵌入式软件开发之Linux下C... 目录 前沿 Hello World! 编写代码 编译代码 GCC编译器  gcc 命...
云原生|Rancher与Ope... 目录一、Rancher(一)介绍(二)优点&...
如何突破卫星影像建模难点?重建... 日前,由重建大师生成的首个“珞珈三号01星”卫星影像三维模型一经发出,引...
L1-085 试试手气 L1... 我们知道一个骰子有 6 个面,分别刻了 1 到 6 个点。下面给你 6 个骰子的初始状...
SpringSecurity客... 概述 FilterChainProxy是spring-security的入口,包含默认...
数据结构--二叉树 目录1.树概念及结构1.1数的概念1.2数的表示2.二叉树概念及结构2.1二叉树的概念2.2数据结构...
Qt之QUrl和QUrlQue... QUrlQUrl 类提供了一个方便的接口使用 URLs。最常见的使用QUrl 的方式是通过构造函数来...
函数指针二三事 1 什么是函数指针? ​ 函数指针,顾名思义,它是一个指向...
[ 红队知识库 ] Windo... 🍬 博主介绍 👨‍🎓 博主介绍:大家好...
【PowerBI】PowerB... 目的: 陈述PowerBI连接Mysql数据库的坑。 方法1:直接使用【...
BI数据可视化|可自动刷新的可... BI数据可视化大屏和其他的BI报表一样,都是可用于日常的决策中,因此除了...
Linux 练习十二 (Lin... 文章目录1 计算机网络基础知识1.1 OSI参考模型和TCP/IP参考模型1.2 TCP 协议1.2...
SQL语言基础教学 | Mys... SQL语言基础教学SQL(Structured Query Languageÿ...
pandas数据分析(三) 书接pandas数据分析(二) 文章目录DataFrame数据处理与分...
DC-DC升压模块隔离高压稳压... 特点● 效率高达 80%● 2*2英寸标准封装● 单双电压输出● 价格低● 大于600V高压,稳压输...
Java【多线程基础2】 Th... 文章目录前言一、Thread类1, 构造方法2, 常用成员属性3, 常用成员方法3.1, start...
TDK| 电源——反激变压器设... 电源参数根据功率、输入输出的情况,我们选择反激电源拓扑。反激式变压器的优点有:1、 电...
Python:判断语句 目录一、布尔类型1.1定义1.2获取二、逻辑运算符2.1and运算符2.2or运算符2.2not运算...
协程池加disruptor加e... 先说一下disrutor和协程的实现。然后介绍服务器具体分析,以及迭代过程,项目困难,学到东西,压测...