fix

Linu-Elias · Linu-Elias · commit a1d89e1cb64b · 2025-06-23T18:00:45.000+05:30
diff --git a/packages/nvidia_gpu/data_stream/stats/elasticsearch/ingest_pipeline/default.yml b/packages/nvidia_gpu/data_stream/stats/elasticsearch/ingest_pipeline/default.yml
@@ -27,7 +27,7 @@ processors:
     ignore_missing: true
 - rename:
     field: prometheus.labels.instance
-    target_field: gpu.labels.instance
+    target_field: server.address
     ignore_missing: true
 - rename:
     field: prometheus.labels.job
diff --git a/packages/nvidia_gpu/data_stream/stats/fields/fields.yml b/packages/nvidia_gpu/data_stream/stats/fields/fields.yml
@@ -23,10 +23,6 @@
           type: keyword
           description: > 
             Nvidia GPU
-        - name: instance
-          type: keyword
-          description: > 
-            Nvidia GPU instance name
         - name: job
           type: keyword
           description: > 
@@ -50,7 +46,7 @@
         - name: uuid
           type: keyword
           description: |
-            Nvidia GPU uuid
+            Nvidia GPU UUID
           dimension: true   
     - name: clock
       type: group
diff --git a/packages/nvidia_gpu/data_stream/stats/sample_event.json b/packages/nvidia_gpu/data_stream/stats/sample_event.json
@@ -1,52 +1,90 @@
 {
-    "@timestamp": "2025-06-19T11:01:58.508Z",
+    "@timestamp": "2025-06-23T12:25:23.237Z",
     "agent": {
-        "ephemeral_id": "5da1c762-479c-4a72-8abb-960a3dcbeae3",
-        "id": "6682006f-8763-47e4-af1d-37a1fb49ce4c",
-        "name": "elastic-agent-62642",
+        "ephemeral_id": "32e01a49-8a7c-4ab3-a27c-10f28999caf7",
+        "id": "d2565d99-5e10-498c-a669-34c328de3746",
+        "name": "docker-fleet-agent",
         "type": "metricbeat",
         "version": "8.17.0"
     },
     "data_stream": {
         "dataset": "nvidia_gpu.stats",
-        "namespace": "85686",
+        "namespace": "default",
         "type": "metrics"
     },
     "ecs": {
         "version": "8.17.0"
     },
     "elastic_agent": {
-        "id": "6682006f-8763-47e4-af1d-37a1fb49ce4c",
+        "id": "d2565d99-5e10-498c-a669-34c328de3746",
         "snapshot": false,
         "version": "8.17.0"
     },
     "event": {
         "agent_id_status": "verified",
         "dataset": "nvidia_gpu.stats",
-        "duration": 18410680,
-        "ingested": "2025-06-19T11:02:01Z",
+        "duration": 84026367,
+        "ingested": "2025-06-23T12:25:24Z",
         "module": "prometheus"
     },
     "gpu": {
+        "clock": {
+            "mem_frequency": 405,
+            "streaming_multiprocessor_frequency": 300
+        },
         "labels": {
-            "instance": "svc-nvidia_gpu:9400",
-            "job": "prometheus"
+            "device": "nvidia0",
+            "driver_version": "525.105.17",
+            "gpu": "0",
+            "hostname": "924e17218b6f",
+            "job": "prometheus",
+            "model_name": "Tesla T4",
+            "pci_bus_id": "00000000:00:04.0",
+            "uuid": "GPU-2492e3fa-2252-1730-0d1a-8d12ab32cdf0"
+        },
+        "license_vgpu_status": 0,
+        "memory": {
+            "framebuffer": {
+                "free_size": 14923,
+                "used_size": 5
+            }
+        },
+        "nvlink": {
+            "bandwidth_total": 0
+        },
+        "pcie": {
+            "replay": 0
         },
-        "up": "1"
+        "power": {
+            "energy_consumption_total": 27649212030,
+            "usage": 12.239
+        },
+        "temperature": {
+            "gpu": 36,
+            "memory": 0
+        },
+        "utilization": {
+            "decoder": {
+                "pct": 0
+            },
+            "encoder": {
+                "pct": 0
+            },
+            "gpu": {
+                "pct": 0
+            },
+            "memory_copy": {
+                "pct": 0
+            }
+        }
     },
     "host": {
         "architecture": "x86_64",
         "containerized": true,
-        "hostname": "elastic-agent-62642",
-        "ip": [
-            "172.18.0.6",
-            "172.25.0.2"
-        ],
-        "mac": [
-            "1A-E2-5B-13-20-FD",
-            "E2-78-59-F3-DA-3E"
-        ],
-        "name": "elastic-agent-62642",
+        "hostname": "docker-fleet-agent",
+        "ip": "172.18.0.8",
+        "mac": "22-18-A8-89-5C-AE",
+        "name": "docker-fleet-agent",
         "os": {
             "family": "",
             "kernel": "5.15.153.1-microsoft-standard-WSL2",
@@ -60,6 +98,9 @@
         "name": "collector",
         "period": 10000
     },
+    "server": {
+        "address": "svc-nvidia_gpu:9400"
+    },
     "service": {
         "address": "http://svc-nvidia_gpu:9400/metrics",
         "type": "prometheus"
diff --git a/packages/nvidia_gpu/docs/README.md b/packages/nvidia_gpu/docs/README.md
@@ -56,54 +56,92 @@ An example event for `stats` looks as following:
 
 ```json
 {
-    "@timestamp": "2025-06-19T11:01:58.508Z",
+    "@timestamp": "2025-06-23T12:25:23.237Z",
     "agent": {
-        "ephemeral_id": "5da1c762-479c-4a72-8abb-960a3dcbeae3",
-        "id": "6682006f-8763-47e4-af1d-37a1fb49ce4c",
-        "name": "elastic-agent-62642",
+        "ephemeral_id": "32e01a49-8a7c-4ab3-a27c-10f28999caf7",
+        "id": "d2565d99-5e10-498c-a669-34c328de3746",
+        "name": "docker-fleet-agent",
         "type": "metricbeat",
         "version": "8.17.0"
     },
     "data_stream": {
         "dataset": "nvidia_gpu.stats",
-        "namespace": "85686",
+        "namespace": "default",
         "type": "metrics"
     },
     "ecs": {
         "version": "8.17.0"
     },
     "elastic_agent": {
-        "id": "6682006f-8763-47e4-af1d-37a1fb49ce4c",
+        "id": "d2565d99-5e10-498c-a669-34c328de3746",
         "snapshot": false,
         "version": "8.17.0"
     },
     "event": {
         "agent_id_status": "verified",
         "dataset": "nvidia_gpu.stats",
-        "duration": 18410680,
-        "ingested": "2025-06-19T11:02:01Z",
+        "duration": 84026367,
+        "ingested": "2025-06-23T12:25:24Z",
         "module": "prometheus"
     },
     "gpu": {
+        "clock": {
+            "mem_frequency": 405,
+            "streaming_multiprocessor_frequency": 300
+        },
         "labels": {
-            "instance": "svc-nvidia_gpu:9400",
-            "job": "prometheus"
+            "device": "nvidia0",
+            "driver_version": "525.105.17",
+            "gpu": "0",
+            "hostname": "924e17218b6f",
+            "job": "prometheus",
+            "model_name": "Tesla T4",
+            "pci_bus_id": "00000000:00:04.0",
+            "uuid": "GPU-2492e3fa-2252-1730-0d1a-8d12ab32cdf0"
+        },
+        "license_vgpu_status": 0,
+        "memory": {
+            "framebuffer": {
+                "free_size": 14923,
+                "used_size": 5
+            }
+        },
+        "nvlink": {
+            "bandwidth_total": 0
+        },
+        "pcie": {
+            "replay": 0
         },
-        "up": "1"
+        "power": {
+            "energy_consumption_total": 27649212030,
+            "usage": 12.239
+        },
+        "temperature": {
+            "gpu": 36,
+            "memory": 0
+        },
+        "utilization": {
+            "decoder": {
+                "pct": 0
+            },
+            "encoder": {
+                "pct": 0
+            },
+            "gpu": {
+                "pct": 0
+            },
+            "memory_copy": {
+                "pct": 0
+            }
+        }
     },
     "host": {
         "architecture": "x86_64",
         "containerized": true,
-        "hostname": "elastic-agent-62642",
-        "ip": [
-            "172.18.0.6",
-            "172.25.0.2"
-        ],
-        "mac": [
-            "1A-E2-5B-13-20-FD",
-            "E2-78-59-F3-DA-3E"
-        ],
-        "name": "elastic-agent-62642",
+        "hostname": "docker-fleet-agent",
+        "ip": "172.18.0.8",
+        "mac": "22-18-A8-89-5C-AE",
+        "name": "docker-fleet-agent",
         "os": {
             "family": "",
             "kernel": "5.15.153.1-microsoft-standard-WSL2",
@@ -117,6 +155,9 @@ An example event for `stats` looks as following:
         "name": "collector",
         "period": 10000
     },
+    "server": {
+        "address": "svc-nvidia_gpu:9400"
+    },
     "service": {
         "address": "http://svc-nvidia_gpu:9400/metrics",
         "type": "prometheus"
@@ -158,11 +199,10 @@ An example event for `stats` looks as following:
 | gpu.labels.err_msg | Nvidia GPU error message | keyword |  |  |
 | gpu.labels.gpu | Nvidia GPU | keyword |  |  |
 | gpu.labels.hostname | Nvidia GPU hostname | keyword |  |  |
-| gpu.labels.instance | Nvidia GPU instance name | keyword |  |  |
 | gpu.labels.job | Nvidia GPU job | keyword |  |  |
 | gpu.labels.model_name | Nvidia GPU model name | keyword |  |  |
 | gpu.labels.pci_bus_id | Nvidia GPU pci bus id | keyword |  |  |
-| gpu.labels.uuid | Nvidia GPU uuid | keyword |  |  |
+| gpu.labels.uuid | Nvidia GPU UUID | keyword |  |  |
 | gpu.license_vgpu_status | vGPU License status. | long |  | gauge |
 | gpu.memory.framebuffer.free_size | Free size of the framebuffer (in MiB). | float |  | gauge |
 | gpu.memory.framebuffer.used_size | Used size of the framebuffer (in MiB). | float |  | gauge |