非正交多址接入(Non-Orthogonal Multiple Access,NOMA)是解决未来大规模接入场景的潜在技术,在多小区NOMA系统中干扰情况变得异常复杂,既存在小区间干扰,又存在NOMA用户间干扰.为了满足特定的用户服务质量,功率控制变得十分重要,针对多小区、多用户NOMA上行功率控制问题展开研究.为了对抗路径损耗的影响,且在基站处有效区分各用户信号,提出了多路径损耗补偿因子的部分功率控制(Fractional Power Control,FPC)方案,其有效地解决了已有等路径损耗补偿因子功率控制方案的不足.为了进一步使各个用户获得最优的上行路径损耗补偿因子,提出使用强化学习中的Q-learning算法联合优化NOMA系统远近用户的路径损耗补偿因子,其可同时兼顾小区间干扰与NOMA用户间干扰.仿真结果表明,提出的功率控制方案可以获得比已有方案更高的和速率性能.