tencent cloud

文档反馈

获取 GooseFS 监控指标

最后更新时间:2022-03-09 18:02:48

    Goosefs 基于 Coda Hale Metrics Library 库记录监控数据,支持通过命令行、控制台、文件等多种途径获取指标,目前支持的指标获取方式包括:

    • MetricsServlet:将监控指标以 Json 格式提供给用户。
    • CsvSink:通过 CSV 文件方式展示监控指标,配置后会周期性地生成记录监控指标的 CSV 文件。
    • PrometheusMetricsServlet:将监控指标以 Prometheus 定义的格式提供给用户。

    上述监控指标的配置可以通过配置文件来指定。GooseFS 监控指标的配置文件默认文件路径为 $ GooseFS_HOME/conf/metrics.properties,支持通过 goosefs.metrics.conf.file 指定自定义监控配置文件。GooseFS 为用户提供了一个默认模板 metrics.properties.template,包含了所有可配置的属性。

    获取监控指标

    以下介绍三种基础的获取监控指标的途径:

    1. 通过 JSON 格式拉取监控指标

    GooseFS 默认的获取监控指标的方式是通过 JSON 格式拉取,对应着 MetricsServlet 这一配置项。可以在命令行中向 GooseFS 的 Leading Master 节点发起一个 HTTP 请求,拉取所需的监控指标,其中 master 的 metrics 端口为9201,worker 的 metrics 端口为 9204。请求指令格式如下:

    $ curl <LEADING_MASTER_HOSTNAME>:<MASTER_WEB_PORT>/metrics/json
    

    如上示例中, 需要是合法的 MASTER 节点的IP, 需要为已经启用的端口。

    如果需要获取某个 WORKER 节点的监控指标,可以通过如下方式获取:

    $ curl <WORKER_HOSTNAME>:<WORKER_WEB_PORT>/metrics/json
    

    2. 通过 CSV 文件获取监控指标

    GooseFS 支持将数据导出为 CSV 格式文件,通过该能力获取监控指标,首先需要准备一个存储监控指标的目录:

    $ mkdir /tmp/goosefs-metrics
    

    准备好存储路径后,修改配置文件 conf/metrics.properties ,启用 CsvSink 能力:

    sink.csv.class=goosefs.metrics.sink.CsvSink # 启用CsvSink能力
    sink.csv.period=1 # 设置监控指标导出周期
    sink.csv.unit=senconds # 设置监控指标导出周期的单位
    sink.csv.directory=/tmp/goosefs-metrics # 设置监控指标导出路径
    

    配置好后需要重启节点以便配置生效。配置生效后,监控指标将周期性地导出成 CSV 格式并存储在指定路径下。

    注意:

    • GooseFS 准备了监控配置模板,可以参考 conf/metrics.properties.template文件;
    • 如果 GooseFS 是集群化部署,需要保证指定的指标存储路径能被所有节点读取。

    3. 拉取 Prometheus 监控指标

    GooseFS master 和 worker 的 Prometheus 的监控指标可用如下的命令查看,其中 master 的 metrics 端口为9201,worker 的 metrics 端口为 9204:

    curl <LEADING_MASTER_HOSTNAME>:<MASTER_WEB_PORT>/metrics/prometheus/
    # HELP Master_CreateFileOps Generated from Dropwizard metric import (metric=Master.CreateFileOps, type=com.codahale.metrics.Counter)
    ...
    curl <WORKER_IP>:<WOKER_PORT>/metrics/prometheus/
    # HELP pools_Code_Cache_max Generated from Dropwizard metric import (metric=pools.Code-Cache.max, type=com.codahale.metrics.jvm.MemoryUsageGaugeSet$$Lambda$51/137460818)
    ...
    

    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持