permserver.go 18 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398
  1. package server
  2. import (
  3. "context"
  4. "errors"
  5. "fmt"
  6. "net"
  7. "time"
  8. "perms-system-server/internal/consts"
  9. authHelper "perms-system-server/internal/logic/auth"
  10. pub "perms-system-server/internal/logic/pub"
  11. "perms-system-server/internal/loaders"
  12. "perms-system-server/internal/middleware"
  13. userModel "perms-system-server/internal/model/user"
  14. "perms-system-server/internal/svc"
  15. "perms-system-server/pb"
  16. "github.com/zeromicro/go-zero/core/limit"
  17. "github.com/zeromicro/go-zero/core/logx"
  18. "golang.org/x/crypto/bcrypt"
  19. "google.golang.org/grpc/codes"
  20. "google.golang.org/grpc/peer"
  21. "google.golang.org/grpc/status"
  22. )
  23. // unknownPeerBucket 当无法解析对端 IP 时共享的限流桶 key。
  24. // 生产环境 gRPC-over-TCP 必然有 peer.Addr,正常流量不会落到这里;此常量仅为 in-process/socket
  25. // 等边缘路径兜底,避免 M-7 审计指出的"按 p.Addr.String() 取完整 host:port 导致限流形同虚设"的
  26. // 随端口漂移问题。共享同一个 key 会放大 DoS 面(所有未知 peer 共用一个计数器),但在此类路径
  27. // 不走真实业务流量的前提下收益足够。
  28. const unknownPeerBucket = "unknown"
  29. // extractClientIP 从 gRPC context 中提取对端 IP。显式剥离端口号(M-7):gRPC 的 p.Addr.String()
  30. // 形如 "1.2.3.4:54321",端口每次连接都变,若直接作为限流 key 相当于没限流。
  31. // 解析失败返回 error,由上层按场景决定是 fail-close(RefreshToken 敏感路径)还是降级到 unknown 桶
  32. // (VerifyToken 契约层约束不允许返回 error)。
  33. func extractClientIP(ctx context.Context) (string, error) {
  34. p, ok := peer.FromContext(ctx)
  35. if !ok || p == nil || p.Addr == nil {
  36. return "", errors.New("peer not identifiable")
  37. }
  38. host, _, err := net.SplitHostPort(p.Addr.String())
  39. if err != nil || host == "" {
  40. return "", errors.New("peer address invalid")
  41. }
  42. return host, nil
  43. }
  44. // PermServer 权限管理系统 gRPC 服务实现,供接入产品的服务端调用。
  45. type PermServer struct {
  46. svcCtx *svc.ServiceContext
  47. pb.UnimplementedPermServiceServer
  48. }
  49. func NewPermServer(svcCtx *svc.ServiceContext) *PermServer {
  50. return &PermServer{svcCtx: svcCtx}
  51. }
  52. // SyncPermissions 同步权限声明。产品服务端通过 appKey/appSecret 认证后批量同步权限定义(新增/更新/禁用不在列表中的权限)。
  53. func (s *PermServer) SyncPermissions(ctx context.Context, req *pb.SyncPermissionsReq) (*pb.SyncPermissionsResp, error) {
  54. // 审计 M-R11-1:appKey 维度入口限流。此处不在有效性校验前做拦截是有意的——
  55. // 桶 key 走 `req.AppKey` 的字面值,恶意方若只为耗配额而瞎填 AppKey,最多能把若干"不存在产品"
  56. // 的计数器打到上限;对真实产品不构成放大。bcrypt.Compare(appSecret) 的 CPU 成本与事务级 X
  57. // 锁(LockByCodeTx)都在限流之后才发生,恶意重放会被 OverQuota 提前截断。
  58. if s.svcCtx.GrpcSyncLimiter != nil && req.AppKey != "" {
  59. code, _ := s.svcCtx.GrpcSyncLimiter.Take(fmt.Sprintf("grpc:sync:%s", req.AppKey))
  60. if code == limit.OverQuota {
  61. return nil, status.Error(codes.ResourceExhausted, "请求过于频繁,请稍后再试")
  62. }
  63. }
  64. items := make([]pub.SyncPermItem, len(req.Perms))
  65. for i, p := range req.Perms {
  66. items[i] = pub.SyncPermItem{Code: p.Code, Name: p.Name, Remark: p.Remark}
  67. }
  68. result, err := pub.ExecuteSyncPerms(ctx, s.svcCtx, req.AppKey, req.AppSecret, items)
  69. if err != nil {
  70. if se, ok := err.(*pub.SyncPermsError); ok {
  71. // 审计 M-2:404 是 tx 内 LockByCodeTx 命中 sqlx.ErrNotFound(产品行被并发删除)
  72. // 的语义,先于 400/401 前的前置校验放行后才可能出现。接入方 SDK 对 NotFound 一般
  73. // 配置"按业务未命中处理/不重试",若在这里落到 default 分支被统一成 codes.Internal,
  74. // 接入方会把一次正常的"产品不存在"当作系统故障 page 值班,扭曲重试与告警语义。
  75. switch se.Code {
  76. case 400:
  77. return nil, status.Error(codes.InvalidArgument, se.Message)
  78. case 401:
  79. return nil, status.Error(codes.Unauthenticated, se.Message)
  80. case 403:
  81. return nil, status.Error(codes.PermissionDenied, se.Message)
  82. case 404:
  83. return nil, status.Error(codes.NotFound, se.Message)
  84. case 409:
  85. return nil, status.Error(codes.Aborted, se.Message)
  86. default:
  87. return nil, status.Error(codes.Internal, se.Message)
  88. }
  89. }
  90. return nil, status.Error(codes.Internal, "同步权限失败")
  91. }
  92. return &pb.SyncPermissionsResp{Added: result.Added, Updated: result.Updated, Disabled: result.Disabled}, nil
  93. }
  94. // Login 产品端登录。产品成员通过用户名密码 + productCode 登录,返回 JWT 令牌对及用户权限信息。受 IP 维度限流保护。
  95. func (s *PermServer) Login(ctx context.Context, req *pb.LoginReq) (*pb.LoginResp, error) {
  96. clientIP, ipErr := extractClientIP(ctx)
  97. if ipErr != nil {
  98. // 审计 M-7 的核心修复是"把 host:port 剥成 host,避免端口漂移让限流失效";
  99. // 生产环境 gRPC 必有 peer,这里走不到;in-process/单测等边缘路径回落到共享 unknown 桶,
  100. // 上层仍会继续执行用户名级的 UsernameLoginLimit,不会造成防护真空。
  101. clientIP = unknownPeerBucket
  102. }
  103. if s.svcCtx.GrpcLoginLimiter != nil {
  104. code, _ := s.svcCtx.GrpcLoginLimiter.Take(fmt.Sprintf("grpc:login:%s", clientIP))
  105. if code == limit.OverQuota {
  106. return nil, status.Error(codes.ResourceExhausted, "请求过于频繁,请稍后再试")
  107. }
  108. }
  109. if req.ProductCode == "" {
  110. return nil, status.Error(codes.InvalidArgument, "productCode不能为空")
  111. }
  112. result, err := pub.ValidateProductLogin(ctx, s.svcCtx, req.Username, req.Password, req.ProductCode, clientIP)
  113. if err != nil {
  114. if le, ok := err.(*pub.LoginError); ok {
  115. switch le.Code {
  116. case 400:
  117. return nil, status.Error(codes.InvalidArgument, le.Message)
  118. case 401:
  119. return nil, status.Error(codes.Unauthenticated, le.Message)
  120. case 403:
  121. return nil, status.Error(codes.PermissionDenied, le.Message)
  122. case 429:
  123. return nil, status.Error(codes.ResourceExhausted, le.Message)
  124. }
  125. }
  126. return nil, status.Error(codes.Internal, "登录失败")
  127. }
  128. ud := result.UserDetails
  129. return &pb.LoginResp{
  130. AccessToken: result.AccessToken,
  131. RefreshToken: result.RefreshToken,
  132. Expires: time.Now().Unix() + s.svcCtx.Config.Auth.AccessExpire,
  133. UserId: ud.UserId,
  134. Username: ud.Username,
  135. Nickname: ud.Nickname,
  136. MemberType: ud.MemberType,
  137. Perms: ud.Perms,
  138. }, nil
  139. }
  140. // RefreshToken 刷新令牌。使用有效的 refreshToken 换取新的令牌对,同时原子 CAS 递增 tokenVersion
  141. // 使旧令牌即时失效(单会话轮转)。受 IP 维度限流保护,防止签名爆破和并发刷新被用于会话劫持。
  142. func (s *PermServer) RefreshToken(ctx context.Context, req *pb.RefreshTokenReq) (*pb.RefreshTokenResp, error) {
  143. clientIP, ipErr := extractClientIP(ctx)
  144. if ipErr != nil {
  145. // 和 Login 相同,IP 解析失败走共享 unknown 桶;后续 CAS(IncrementTokenVersionIfMatch)
  146. // 和 per-user TokenOpLimiter 仍然兜底 session 劫持路径。
  147. clientIP = unknownPeerBucket
  148. }
  149. if s.svcCtx.GrpcRefreshLimiter != nil {
  150. code, _ := s.svcCtx.GrpcRefreshLimiter.Take(fmt.Sprintf("grpc:refresh:%s", clientIP))
  151. if code == limit.OverQuota {
  152. return nil, status.Error(codes.ResourceExhausted, "请求过于频繁,请稍后再试")
  153. }
  154. }
  155. claims, err := authHelper.ParseRefreshToken(req.RefreshToken, s.svcCtx.Config.Auth.RefreshSecret)
  156. if err != nil {
  157. return nil, status.Error(codes.Unauthenticated, "refreshToken无效或已过期")
  158. }
  159. productCode := claims.ProductCode
  160. if req.ProductCode != "" && req.ProductCode != productCode {
  161. return nil, status.Error(codes.InvalidArgument, "刷新令牌不允许切换产品")
  162. }
  163. ud, err := s.svcCtx.UserDetailsLoader.Load(ctx, claims.UserId, productCode)
  164. if err != nil {
  165. // 与"用户已删除"区分:基础设施短时不可用走 Unavailable,token 不作废让客户端重试
  166. // (见审计 M-1)。
  167. return nil, status.Error(codes.Unavailable, "服务暂时不可用,请稍后重试")
  168. }
  169. if ud.Username == "" {
  170. return nil, status.Error(codes.Unauthenticated, "用户不存在或已被删除")
  171. }
  172. if ud.Status != consts.StatusEnabled {
  173. return nil, status.Error(codes.PermissionDenied, "账号已被冻结")
  174. }
  175. if productCode != "" && ud.ProductStatus != consts.StatusEnabled {
  176. return nil, status.Error(codes.PermissionDenied, "该产品已被禁用")
  177. }
  178. if productCode != "" && !ud.IsSuperAdmin && ud.MemberType == "" {
  179. return nil, status.Error(codes.PermissionDenied, "您已不是该产品的成员")
  180. }
  181. if claims.TokenVersion != ud.TokenVersion {
  182. return nil, status.Error(codes.Unauthenticated, "登录状态已失效,请重新登录")
  183. }
  184. if s.svcCtx.TokenOpLimiter != nil {
  185. code, _ := s.svcCtx.TokenOpLimiter.Take(fmt.Sprintf("grpc-refresh-u:%d", claims.UserId))
  186. if code == limit.OverQuota {
  187. return nil, status.Error(codes.ResourceExhausted, "刷新操作过于频繁,请稍后再试")
  188. }
  189. }
  190. // 审计 L-R11-5:两条 RefreshToken 路径复用 authHelper.RotateRefreshToken,避免"试签 → CAS →
  191. // Clean → forensic 比对"四步重复两次。gRPC 侧只做错误到 status code 的映射。
  192. tokens, err := authHelper.RotateRefreshToken(ctx, s.svcCtx, claims, ud)
  193. if err != nil {
  194. if errors.Is(err, userModel.ErrTokenVersionMismatch) {
  195. return nil, status.Error(codes.Unauthenticated, "登录状态已失效,请重新登录")
  196. }
  197. return nil, status.Error(codes.Internal, "刷新token失败")
  198. }
  199. return &pb.RefreshTokenResp{
  200. AccessToken: tokens.AccessToken,
  201. RefreshToken: tokens.RefreshToken,
  202. Expires: time.Now().Unix() + s.svcCtx.Config.Auth.AccessExpire,
  203. }, nil
  204. }
  205. // VerifyToken 验证令牌。校验 accessToken 的有效性(签名、过期、用户状态、产品状态、成员资格、tokenVersion),
  206. // 有效时返回用户身份和权限信息。受 IP 维度限流保护,防止下游被攻破后把权限中心当作 token oracle 做爆破。
  207. //
  208. // 注意:本方法对外契约是"任何畸形/非法 token 都只返回 Valid=false,不返回 gRPC 错误"(见 fuzz 契约测试),
  209. // 因此 IP 解析失败时不能走 fail-close,改为降级到共享 "unknown" 限流桶——仍然有限速,但不破坏上游产品网关
  210. // 的稳定错误分类;真正过载时用 ResourceExhausted 响应。
  211. func (s *PermServer) VerifyToken(ctx context.Context, req *pb.VerifyTokenReq) (*pb.VerifyTokenResp, error) {
  212. clientIP, ipErr := extractClientIP(ctx)
  213. if ipErr != nil {
  214. clientIP = "unknown"
  215. }
  216. if s.svcCtx.GrpcVerifyLimiter != nil {
  217. code, _ := s.svcCtx.GrpcVerifyLimiter.Take(fmt.Sprintf("grpc:verify:%s", clientIP))
  218. if code == limit.OverQuota {
  219. return nil, status.Error(codes.ResourceExhausted, "请求过于频繁,请稍后再试")
  220. }
  221. }
  222. token, err := middleware.ParseWithHMAC(req.AccessToken, s.svcCtx.Config.Auth.AccessSecret, &middleware.Claims{})
  223. if err != nil || !token.Valid {
  224. logx.WithContext(ctx).Infof("verifyToken fail reason=invalid_token")
  225. return &pb.VerifyTokenResp{Valid: false}, nil
  226. }
  227. claims, ok := token.Claims.(*middleware.Claims)
  228. if !ok || claims.TokenType != consts.TokenTypeAccess {
  229. logx.WithContext(ctx).Infof("verifyToken fail reason=bad_claims")
  230. return &pb.VerifyTokenResp{Valid: false}, nil
  231. }
  232. ud, err := s.svcCtx.UserDetailsLoader.Load(ctx, claims.UserId, claims.ProductCode)
  233. if err != nil {
  234. // VerifyToken 的对外契约是"任何 token 问题只回 Valid=false,不抛 gRPC 错误"。但基础设施
  235. // 故障不属于"token 问题"——同化为 Valid=false 会让下游把合法用户踢出登录(见审计 M-1)。
  236. // 走 Unavailable,由下游按瞬时故障重试而不是据此清 token。
  237. logx.WithContext(ctx).Errorf("verifyToken: load user details failed: %v", err)
  238. return nil, status.Error(codes.Unavailable, "服务暂时不可用,请稍后重试")
  239. }
  240. if ud.Username == "" {
  241. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=user_not_found", claims.UserId)
  242. return &pb.VerifyTokenResp{Valid: false}, nil
  243. }
  244. if ud.Status != consts.StatusEnabled {
  245. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=user_disabled", claims.UserId)
  246. return &pb.VerifyTokenResp{Valid: false}, nil
  247. }
  248. if claims.TokenVersion != ud.TokenVersion {
  249. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=token_version_mismatch", claims.UserId)
  250. return &pb.VerifyTokenResp{Valid: false}, nil
  251. }
  252. if claims.ProductCode != "" && ud.ProductStatus != consts.StatusEnabled {
  253. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=product_disabled product=%s", claims.UserId, claims.ProductCode)
  254. return &pb.VerifyTokenResp{Valid: false}, nil
  255. }
  256. if claims.ProductCode != "" && !ud.IsSuperAdmin && ud.MemberType == "" {
  257. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=not_member product=%s", claims.UserId, claims.ProductCode)
  258. return &pb.VerifyTokenResp{Valid: false}, nil
  259. }
  260. return &pb.VerifyTokenResp{
  261. Valid: true,
  262. UserId: ud.UserId,
  263. Username: ud.Username,
  264. MemberType: ud.MemberType,
  265. Perms: ud.Perms,
  266. ProductCode: claims.ProductCode,
  267. }, nil
  268. }
  269. // GetUserPerms 查询用户权限。产品服务端通过 appKey/appSecret 认证后查询指定用户在该产品下的成员类型和权限列表,用于产品侧的权限网关判定。
  270. func (s *PermServer) GetUserPerms(ctx context.Context, req *pb.GetUserPermsReq) (*pb.GetUserPermsResp, error) {
  271. // 审计 M-R11-1:入口限流,双维度(appKey + 源 IP)叠加。
  272. // - appKey 维度抵御"合法产品凭证泄露后遍历 userId 爆缓存/打穿 DB";
  273. // - IP 维度抵御"同一产品多后端实例被 DDoS 放大时把合法产品打过配额";两者谁先过限都拒绝,
  274. // 以真实业务量级(单产品最多数千活跃成员、单 userId QPS 远低于 1k/min)来衡量不会误杀。
  275. if s.svcCtx.GrpcGetUserPermsLimiter != nil && req.AppKey != "" {
  276. code, _ := s.svcCtx.GrpcGetUserPermsLimiter.Take(fmt.Sprintf("grpc:perms:%s", req.AppKey))
  277. if code == limit.OverQuota {
  278. return nil, status.Error(codes.ResourceExhausted, "请求过于频繁,请稍后再试")
  279. }
  280. }
  281. if s.svcCtx.GrpcGetUserPermsLimiter != nil {
  282. clientIP, ipErr := extractClientIP(ctx)
  283. if ipErr != nil {
  284. clientIP = unknownPeerBucket
  285. }
  286. code, _ := s.svcCtx.GrpcGetUserPermsLimiter.Take(fmt.Sprintf("grpc:perms-ip:%s", clientIP))
  287. if code == limit.OverQuota {
  288. return nil, status.Error(codes.ResourceExhausted, "请求过于频繁,请稍后再试")
  289. }
  290. }
  291. product, err := s.svcCtx.SysProductModel.FindOneByAppKey(ctx, req.AppKey)
  292. if err != nil {
  293. return nil, status.Error(codes.Unauthenticated, "无效的appKey")
  294. }
  295. if err := bcrypt.CompareHashAndPassword([]byte(product.AppSecret), []byte(req.AppSecret)); err != nil {
  296. return nil, status.Error(codes.Unauthenticated, "appSecret验证失败")
  297. }
  298. if product.Status != consts.StatusEnabled {
  299. return nil, status.Error(codes.PermissionDenied, "产品已被禁用")
  300. }
  301. if product.Code != req.ProductCode {
  302. return nil, status.Error(codes.InvalidArgument, "appKey与productCode不匹配")
  303. }
  304. ud, err := s.svcCtx.UserDetailsLoader.Load(ctx, req.UserId, req.ProductCode)
  305. if err != nil {
  306. return nil, status.Error(codes.Unavailable, "服务暂时不可用,请稍后重试")
  307. }
  308. // 审计 L-R10-10:消除"userId 是否在全局 sys_user 中存在"的枚举 oracle。原实现在 Username=""
  309. // 时回 NotFound、在非成员时回 PermissionDenied,持合法 appKey 的产品服务端可遍历 userId 区分
  310. // "这个 userId 在全局 sys_user 里存在" vs "不在"。统一回 NotFound "用户不是该产品的有效成员",
  311. // 与 REST 侧 RoleDetail 的修复口径对齐(M-N3)。
  312. // 保留"用户已被冻结"为显式 PermissionDenied:密码正确才能拿到合法 appKey 这一前提不成立时,
  313. // 这个状态已经是上层业务承诺披露的信息,不构成新增枚举面。
  314. if ud.Username == "" || (!ud.IsSuperAdmin && ud.MemberType == "") {
  315. logx.WithContext(ctx).Infof("getUserPerms not-found or non-member userId=%d productCode=%s", req.UserId, req.ProductCode)
  316. return nil, status.Error(codes.NotFound, "用户不是该产品的有效成员")
  317. }
  318. if ud.Status != consts.StatusEnabled {
  319. return nil, status.Error(codes.PermissionDenied, "用户已被冻结")
  320. }
  321. return &pb.GetUserPermsResp{
  322. MemberType: ud.MemberType,
  323. Perms: ud.Perms,
  324. }, nil
  325. }
  326. // Logout 用户登出。解析 accessToken 获取用户身份,递增 tokenVersion 使所有令牌立即失效并清除缓存。
  327. func (s *PermServer) Logout(ctx context.Context, req *pb.LogoutReq) (*pb.LogoutResp, error) {
  328. if req.AccessToken == "" {
  329. return nil, status.Error(codes.InvalidArgument, "accessToken不能为空")
  330. }
  331. token, err := middleware.ParseWithHMAC(req.AccessToken, s.svcCtx.Config.Auth.AccessSecret, &middleware.Claims{})
  332. if err != nil || !token.Valid {
  333. return nil, status.Error(codes.Unauthenticated, "accessToken无效或已过期")
  334. }
  335. claims, ok := token.Claims.(*middleware.Claims)
  336. if !ok || claims.TokenType != consts.TokenTypeAccess {
  337. return nil, status.Error(codes.Unauthenticated, "accessToken无效")
  338. }
  339. if s.svcCtx.TokenOpLimiter != nil {
  340. code, _ := s.svcCtx.TokenOpLimiter.Take(fmt.Sprintf("logout:%d", claims.UserId))
  341. if code == limit.OverQuota {
  342. return nil, status.Error(codes.ResourceExhausted, "操作过于频繁,请稍后再试")
  343. }
  344. }
  345. if _, err := s.svcCtx.SysUserModel.IncrementTokenVersion(ctx, claims.UserId, claims.Username); err != nil {
  346. if !errors.Is(err, userModel.ErrUpdateConflict) {
  347. return nil, status.Error(codes.Internal, "登出失败")
  348. }
  349. logx.WithContext(ctx).Infof("grpc logout on already-deleted user userId=%d, treated as idempotent success", claims.UserId)
  350. }
  351. cleanCtx, cancel := loaders.DetachCacheCleanCtx(ctx)
  352. defer cancel()
  353. s.svcCtx.UserDetailsLoader.Clean(cleanCtx, claims.UserId)
  354. return &pb.LogoutResp{}, nil
  355. }