近日,我院李刚研究员课题组在跨设备联邦学习方面取得了新的进展,研究成果以“Incentive Mechanism Design for Cross-Device Federated Learning: A Reinforcement Auction Approach”为题,发表于国际移动计算领域顶级期刊、中国计算机协会(CCF)推荐A类期刊IEEE Transactions on Mobile Computing (IEEE TMC),内蒙古大学为第一完成单位。
跨设备联邦学习中需要设计高效的激励机制,以此来吸引足够多的用户参与联邦学习,提高模型精度和泛化能力。目前的设计主要局限于网络层,没有充分考虑到资源受限的终端对模型训练性能的影响。针对这一问题,论文设计了一种基于强化学习的拍卖机制 (RAM),该机制包括上下两层,其中上层采用强化学习来模拟拍卖机制,给出终端设备选择策略和奖励策略,而将终端设备上的资源分配方案放在下层实施,中央控制单元可以不需要事先知晓终端设备的相关信息,如计算能力和通信能力。
论文作者包括:李刚研究员(第一作者),加拿大康考迪亚大学(Concordia University)Jun Cai教授,以及武汉科技大学鲁剑锋教授等。这项研究得到了自治区留学人员创新创业启动支持计划、内蒙古大学“骏马计划”高层次人才引进项目等项目的支持。
论文链接:https://ieeexplore.ieee.org/document/10770572