使用 ClickHouse 时有哪些注意点?
分区和索引 分区粒度根据业务特点决定,不宜过粗或过细。一般选择按天分区,也可指定为 tuple();以单表 1 亿数据为例,分区大小控制在 10-30 个为最佳。 必须指定索引列,clic...
文章
1.7W+评论
3.5W+浏览
795W+标签
7.2K+分区和索引 分区粒度根据业务特点决定,不宜过粗或过细。一般选择按天分区,也可指定为 tuple();以单表 1 亿数据为例,分区大小控制在 10-30 个为最佳。 必须指定索引列,clic...
1. 绝大多数请求都是用于读访问的; 2. 数据需要以大批次(大于 1000 行)进行更新,而不是单行更新; 3. 数据只是添加到数据库,没有必要修改; 4. 读取数据时,会从数据库中提取...
主键索引 索引列中的值必须是唯一的,不允许有空值。 普通索引 MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值。 唯一索引 索引列中的值必须是唯一的,但是允...
SQL 标准定义了四个隔离级别: READ-UNCOMMITTED(读取未提交): 最低的隔离级别,允许读取尚未提交的数据变更,可 能会导致脏读、幻读或不可重复读。 READ-COMMIT...
1、查询语句中不要使用select * 2、尽量减少子查询,使用关联查询(left join,right join,inner join)替代 3、减少使用IN或者NOT IN ,使用exi...
如何查看mysql提供的所有存储引擎 ``` mysql> show engines; ``` , MergeTree 引擎没有参数。 ORDER BY: order by 设定了分区内的数据按照哪些字段顺序进⾏有序保 存。 or...
分布式协调:这个其实就是 zk 很经典的⼀个⽤法,简单来说,就好⽐,你系统 A发送个请求到 mq,然后 B 消费了之后处理。那 A系统如何指导 B系统的处理结果?⽤ zk 就可以实现分布式系统...
GBDT是机器学习算法,XGBoost是该算法的工程实现 传统GBDT以CART作为基分类器,XGBoost还支持线性分类器,这个时候XGBoost相当于带L1和L2正则化项的Logistic...
TP:将正类预测为正类数 FN:将正类预测为负类数 FP:将负类预测为正类数 TN:将负类预测为负类数 ###分类任务指标 Accuracy(准确率):分类正确的样...
回归模型常用的损失函数有: 0-1损失函数: $$ L(f(x),y) = \begin{cases} 1, & y \neq f(x) \ 0, & y = f(x) \end{case...
(1)、不可中断状态:进程处于睡眠状态,但是此刻进程是不可中断的。不可中断, 指进程不响应异步信号。 (2)、暂停状态/跟踪状态:向进程发送一个 SIGSTOP 信号,它就会因响应该信号 而进...
Linux和Unix都是功能强大的操作系统,都是应用广泛的服务器操作系统,有很多相似之处,甚至有一部分人错误地认为Unix和Linux操作系统是一样的,然而,事实并非如此,以下是两者的区别。 ...
line-height 是相对于元素自身的字体大小来取值,但同时会被继承。在实际工作中,取值 2em 或者 200% 有可能遇到未预测的内容。 比如: 父元素: fontSize: ...
###button 没有默认行为的按钮,上面显示 value 属性的值,默认为空。 ``` ``` ###checkbox 复选框,可设为选中或未选中。 ``` ```...