بررسی مدل تنفر از بی‌عدالتی در راهکارهای یادگیری تقویتی چند عاملی برای ارتقای کنترل توان در شبکه‌های سلولی بی‌سیم