分布式协调:这个其实就是zk很经典的⼀个⽤法,简单来说,就好⽐,你系统A发送个请求到mq,然后B消费了之后处理。那A系统如何指导B系统的处理结果?⽤zk就可以实现分布式系统之间的协调⼯作。A系统发送请求之后可以在...
如果⼀个server采⽤⼀个进程(或者线程)负责⼀个request的⽅式,那么进程数就是并发数。那么显⽽易⻅的,就是会有很多进程在等待中。等什么?最多的应该是等待⽹络传输。其缺点胖友应该也感觉到了,此处不述。⽽Nginx...
当数据集大的时候使用近似算法:在特征分裂时,根据特征k的分布确定个候选切分点。根据这些切分点把相应的样本放入对应的桶中,对每个桶的进行累加,最后通过遍历所有的候选分裂点来找到最佳分裂点。我们对这么多个桶进行分支判断,显然比起对n个样本...
GBDT是机器学习算法,XGBoost是该算法的工程实现传统GBDT以CART作为基分类器,XGBoost还支持线性分类器,这个时候XGBoost相当于带L1和L2正则化项的Logistic回归(分类问题)或者线性回归(回归问题)。传...
输入:已构造的kd树:目标点;输出:的最近邻(1)在kd树中找出包含目标点的叶节点:从根节点出发,递归地向下访问kd树。若目标点当前维的坐标小于切分点的坐标,则移动到左子节点,否则移动到右子节点。直到子节点为叶节点为止。(2)以此叶节...
kd树是一种对k维空间中的实例点进行存储,以便对其进行快速检索的树形数据结构。kd树是二叉树,表示对k维空间的一个划分。构造kd树相当于不断地用垂直于坐标轴的超平面将k维空间切分,构成一系列的k维超矩形区域。kd树的每个节点对应于一个...
笛卡尔积笛卡尔乘积是指在数学中,两个集合X和Y的笛卡尓积(Cartesianproduct),又称直积,表示为X×Y,第一个对象是X的成员而第二个对象是Y的所有可能有序对的其中一个成员。例如,A={a,b},B={0,1,2},...
概率模型与非概率模型的区别在于模型的内在结构。概率模型一定可以表示为联合概率分布的形式,其中的变量表示输入、输出、因变量甚至参数。而针对非概率模型则不一定存在这样的联合概率分布。统计学习的模型可以分为概率模型(probabilisti...
超参搜索算法一般包括的要素(1)目标函数(2)搜索范围,上限和下限缺点(3)其他参数,如搜索步长。网格搜索查找搜索范围内所有的点来确定最优值;实际应用中先用较大搜索范围和较大步长,寻找全局最优值可能位置;然后逐步缩小搜索范围和搜索步长...
过拟合是指学习时选择的模型所包含的参数过多,以至出现这一模型对已知数据预测得很好,但对未知数据预测得很差的现象。当训练集效果差,欠拟合(如accuracy<0.8);训练集效果好,测试集效果差,过拟合欠拟合解决方法:增加特征提高...
混淆矩阵,又称误差矩阵,就是分别统计分类模型归错类,归对类的观测值个数,然后把结果放在一个表里展示出来。这个表就是混淆矩阵。混淆矩阵是ROC曲线绘制的基础,同时它也是衡量分类型模型准确度中最基本,最直观,计算最简单的方法。TN:Tru...
TP:将正类预测为正类数FN:将正类预测为负类数FP:将负类预测为正类数TN:将负类预测为负类数分类任务指标Accuracy(准确率):分类正确的样本占总样本个数的比例缺点:不同类...
经验风险(经验损失):模型关于训练数据集的平均损失R_{\rmsrm}(f)=\...
回归模型常用的损失函数有:0-1损失函数:L...
确定问题:有监督问题还是无监督问题?回归问题还是分类问题?数据收集与处理特征工程:包括特征构建、特征选择、特征组合等模型训练、调参、评估:包括模型的选择,选择最优的参数模型部署:模型在线上运行的效果直接决定模型的成败
一、操作上需避免的坑1、不要一个手机切换登录不同抖音号,做到一机一卡一号。2、不要花钱去互粉、互赞、刷粉、刷赞,没有任何意义,还会被平台降权3、不要过于频繁的发布作品,会被平台判定为营销号,每天最多2-3个,发布作品之间最好间隔几...
1,codis目前用的最多的集群方案,基本和twemproxy一致的效果,但它支持在节点数量改变情况下,旧节点数据客恢复到新hash节点2rediscluster3.0自带的集群,特点在于他的分布式算法不是一致性hash,而是has...
区别1、redis和Memcache都是将数据存放在内存中,都是内存数据库。不过memcache还可以用于缓存其他东西,例如图片,视频等等2、Redis不仅仅支持简单的k/v类型的数据,同时还提供list,set,hash等数据结构的...
drop直接删掉表,truncate删除表中数据,再插入时自增长id又从1开始,delete删除表中数据,可以加where字句。1.delete语句执行删除的过程是每次从表中删除一行,并且同时将该行的删除操作作为事务记录在日志中保存...
主键:数据库表中对存储数据对象予以唯一和完整标识的数据列或属性的组合。一个数据列只能有一个主键,且主键的取值不能缺失,即不能为空值(Null).超键:在关系中能唯一标识元组的属性集称为关系模式的超键。一个属性可以作为一个超键,多个属性...
宕机:服务器停止服务‘如果只有一台redis,肯定会造成数据丢失,无法挽救多台redis或者是redis集群,宕机则需要分为在主从模式下区分来看:slave从redis宕机,配置主从复制的时候才配置从的redis,从的会从主的red...
django:主要是用来搞快速开发的,他的亮点就是快速开发,节约成本,,如果要实现高并发的话,就要对django进行二次开发,比如把整个笨重的框架给拆掉自己写socket实现http的通信,底层用纯c,c++写提升效率,ORM框架给干...
1.uWSGI是一个Web服务器,它实现了WSGI协议、uwsgi、http等协议。Nginx中HttpUwsgiModule的作用是与uWSGI服务器进行交换。WSGI是一种Web服务器网关接口。它是一个Web服务器(如nginx,...
Django在中间件中预置了六个方法,这六个方法的区别在于不同的阶段执行,对输入或输出进行干预,方法如下:1.初始化:无需任何参数,服务器响应第一个请求的时候调用一次,用于确定是否启用当前中间件def__init__():...
一、日志相关概念1.日志是一种可以追踪某些软件运行时所发生事件的方法2.软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了某些事情3.一个事件可以用一个包含可选变量数据的消息来描述4.此外,事件也有重要性的概念,这个重要...