influxdb 专业术语

以下内容基本全篇摘抄自v1.3的官方文档,先从理解下面这张两张图开始
influxdb_glossary

aggregation 聚合

使用聚合函数对points中的set返回聚合结果

count 返回非null的field values个数
distinct 返回唯一field values列表
integral 由过滤条件组成的积分
mean 返回field values的算术平均值
median 返回field values排序后的中位数
mode 从field values列表中返回最常用的值
spread 最大减去最小
stddev 标准差
sum 求和

batch 批量

为了减少influxdb的负载，建议对point的集合进行上传。使用\n做分割。建议每批包含五千到一万个point

continuous query(CQ) 持续查询

定期执行自动查询并将结果持久化到数据库

database 数据库

和关系型数据库差不多吧。

关系型数据库	influxdb
database	database
table	measurement
row	point
特别点的就是。influxdb有保留策略

duration 持续时间

保留策略的一个属性表示数据会保存多久。数据过期会被执行自动删除

field 字段

对比tag来说field没有被索引。在一段时间范围内查询field的值需要扫描所有的point得到结果。性能没有tag好

field key 字段的key

在key-value对中表示field字段的key.只能是string类型。存储到metadata中

field set 字段的集合

所有field key的集合

field value 字段的值

field的value。类型可以是strings、float、integers、booleans。field的值始终与时间戳相关

function 函数

分三类，聚合、选择、转换

identifier 标识

emmm…持续查询名称、数据库名称、field字段、度量名称、保留策略名称、订阅名称、标签名称、用户名

line protocol 行协议

基于文本格式写入到influxdb

measurement 度量

emmm…可以类比到关系型数据库的table

metastore 元数据存储

包含内部系统的状态信息。元素据存储包含了用户信息、数据库信息、保留侧列、分片元数据、持续查询和订阅

node 节点

一个独立的influxd进程

now()

本地的纳秒时间戳

point 点

在serises中由fields组成的单个数据。每个point由它的series和时间戳组成唯一标识(重点)
对于一个相同的时间戳和相同的series只能保存一个point.如果相同则新的field set覆盖掉旧的

query 查询

从influxdb中查询到相关数据的操作

replication factor 复制因子

对集群有用。O__O “…可是集群并不是免费功能,将一份数据保留到集群上多份

retention policy(RP) 保留策略

以数据库作为单位，分三个方面。保留时长，数据多久进行一次分片操作。数据设置多少个副本。默认autogen表示永不删除、一个副本集(表示没副本)、七天进行一次分片

schema 模式

如何组织数据到influxdb。包含databases、retention policies、series、measurements、tag keys、tag values、field keys

selector 选择器

一个函数，从特定范围的point中返回单个

bottom 返回N个最小的field value
first 返回最开始时间的field value
last 返回最近时间的field value
max 返回最大的field value
min 返回最小的field value
percentile 根据百分比返回
sample 随机返回
top 返回最大的N个field value

series 序列

由measurement、tag set、retention policy组成(注意:field set不在里面)

series cardinality 序列基数

唯一的series数，如果一个measurement有2个tag key。1个有三个唯一的值。另一个有两个。那么序列基数为6.因为tag集合是保存在内存中的。在配置里面也有默认的数量限制

server 服务器

运行influxdb的环境。应该一台服务器只运行一个influxdb进程

shard 分片

包含编码和压缩数据，作为TSM文件保存到磁盘。每个分片属于唯一的一个shard group。每个分片包含了特定的series

shard duration 分片持续时间

由保留策略中的shard duration决定。

shard group 分片组

分片组(保留策略)->shard->data.为了自动删除搞出了这么多概念┑(￣Д ￣)┍

subscription 订阅

O__O “… 好像并没有什么用。搭配kapactior使用。订阅它的数据进行存储

tag

对比field。tag是有索引的

tag key

略

tag set

略

tag value

只能为数字。存储到metadata

timestamp 时间戳

和point关联的时间戳，可以有多种时间格式存储和查询

transformation 变换

特定的点返回值和集合，得到的结果不能用来再次聚合

ceiling 目前还不支持(ceil,floor)
cumulative_sum 将列表变成累加和列表(原有1,1,2,2变成1,2,4,6)
derivative 导数
difference 和第一个结果相减得到不同
elapsed 得到时间戳的不同
floor 目前还不支持
histogram 目前还不支持
moving_average 滚动平均值(原有1,2,3得到1.5,2.5)
non_negative_derivative 非负导数
non_negative_difference 非负不同

tsm(Time Structured Merge tree)

influxdb的专用存储格式。允许高压缩和高速写入读取速度要高于已存在的B+树或者LSM树

user

admin用户具有读写所有数据库的权限并且可以管理用户
非admin有每个数据库的读写权限(被admin分配)

value per second

度量写入速度,比如每个point有四个field,每批有5000个point.写入速度为每秒10个。那么values per second速率为4*5000*10

WAL(write ahead log) 预写日志

略

influxdb 专业术语

aggregation 聚合

batch 批量

continuous query(CQ) 持续查询

database 数据库

duration 持续时间

field 字段

field key 字段的key

field set 字段的集合

field value 字段的值

function 函数

identifier 标识

line protocol 行协议

measurement 度量

metastore 元数据存储

node 节点

now()

point 点

query 查询

replication factor 复制因子

retention policy(RP) 保留策略

schema 模式

selector 选择器

series 序列

series cardinality 序列基数

server 服务器

shard 分片

shard duration 分片持续时间

shard group 分片组

subscription 订阅

tag

tag key

tag set

tag value

timestamp 时间戳

transformation 变换

tsm(Time Structured Merge tree)

user

value per second

WAL(write ahead log) 预写日志

ficapy

博客起航

IDM-Internet Download Manager

everything--文件搜索神器

everything进阶教程

Snagit-截图兼图片转换软件

xnview-图片查看

DeskPins-窗口置顶

傲梅分区助手--傻瓜化分区软件

excel数字递增批量打印

pip使用国内镜像