Recommend System
2024, Aug 10
双塔模型和自监督学习
- 双塔模型学不好低曝光物品的向量表征(因为随机抽样物品时,高曝光的物品更容易被抽到)
- 自监督学习:
- 对物品做随机特征变换,对一个物品用两种特征变换,得到两个特征向量。
- 特征向量\(b_i'\), 和\(b_i''\)相似度高(相同物品)。
- 特征向量\(b_i'\)和\(b_j''\)相似度低(不同物品)。
- 使得不同物品的特征向量尽可能spread out分散在整个向量空间。
- 实验效果:低曝光物品、新物品的推荐变得更准。
模型训练
小结
Recommend System的支线暂时停更,原因如下:
一开始以为在腾讯实习后找别的实习会很轻松,所以想学一些搜广推算法类的东西,给秋招多一些算法岗的选择。但是这几天面试后台开发的实习,发现自己很久没刷题背八股后,后台的实习都被问的支支吾吾,这与我多一些岗位选择的本意背道而驰。
同时在上段实习离职后,回来写论文的时候,我发现自己可能并不擅长创新性的科研,或者说自己更擅长完成某个PM给出需求的coding。
综上所述,最近还是要多刷leetcode灵神题单、后台开发的八股(计网、os)、并做一个后台的项目以巩固redis异步锁、mysql查询语句(lc50题)等相关东西,至少要保证自己在后台开发的竞争力