hostid 下发相关问题的排查方案

  1. 通过 job 在目标 ip 上执行任意作业,确定目标机执行 job 作业是否正常。
  2. 搜索 gse_syncdata 服务进程的日志,检索 关键字 taskdriver,关注warn 和error 级别的信息。
  3. 排查是否目标环境所有ip 都存在此问题,还是仅有个别ip 是错误的。
  4. 排查目标ip 录入cmdb 的云区域与实际部署时配置的是否一致。
  5. 版本依赖关系:gse_syncdata 1.7.9 依赖 cmdb-v3.10.1及以上,gse_syncdata api 配置参数模板,如下:

Note for bk gse

通用检查列表:

  1. 检查 server 节点 ,gse_task、gse_btsvr、gse_dba 及redis 服务进程运行状态,端口监听状态
  2. 检查 agent 与 gse_task 链接状态 端口默认:48668
  3. 检查 gse_task、gse_dba、gse_api 与 zk 的链接,默认端口:2181
  4. 检查 agent 与 gse_task 48668 端口连通性
  5. 直连 区域 agent , 检查 agent 与zk 端口的连通性
  6. 非直连区域 检查 agent 与proxy 端口的连通性,端口默认 48668 ,并检查 proxy 与 gse_task 的端口连通性 48668
  7. 检查 zk 里面/gse/config/server 节点下 及子节点是否存在 对应服务的 ip 地址信息
  8. 服务器之间的时间一致