Path: blob/master/site/zh-cn/federated/collaborations/notes/2022-07-14.md
25118 views
2022 年 7 月 14 日 TFF 协作者会议笔记
参与者:Krzysztof Ostrowski (Google),Boyi Chen (LinkedIn)
Boyi 对 LinkedIn 的进展和计划的更新。
加入 TFF 并集成到 ML 基础架构
在企业解决方案中使用 TFF 进行离线实验
三个目标领域
搭便车攻击
有人既不想做贡献,又想攫取收益
两个目标 - 检测,解决方案
模型中毒的目标不同,但似乎有关联
对严重倾斜的贡献者的偏见
一些贡献者拥有比其他贡献者多得多的数据
这是双向的 - 重量级用户对模型的影响过大,但也有大量轻量级用户拖累性能
跨数据孤岛联合学习,用于混合来自 LinkedIn 和外部的数据
保证数据不混合
模拟设备端联合学习
模拟能力已经存在 - 我们谈的是模拟在现实生产环境中看到的行为
改变设备处理能力等内容的分布,以评估它如何影响训练性能
目前在 Azure 上运行的进展不大,所以暂时不考虑这个问题
贡献/合作模式:
TFF 中用于检测搭便车者并缓解这种情况的算法和组件
设计文档 - 两端人员循环以帮助改进
LinkedIn 可以贡献代码
暂定 LinkedIn 在项目的 TFF 仓库内拥有或共同拥有一个目录 - 一个或多个目录以及目录权限待定
TFF 的计划
赋能合作伙伴搭建基于 TFF 的平台
组件
参考架构
跨数据孤岛和跨设备
一些代码已经在 OSS 中,更多代码即将发布
端到端隐私等,为平台合作伙伴提供保障
后续步骤:
创建单独的提案以与双方人员进行迭代
一起确定优先级
这也许意味着将频率增加到每 2 周一次
选择要展开的主题,循环访问对该主题感兴趣的人