不系舟

人工神经网络（1）基本概念与激活函数

1 基本概念 1.1 神经元 (Neure) 上图是生物神经元的结构。各个神经元传递复杂的电信号，树突接收到输入信号，然后对信号进行处理，通过轴突输出信号。人脑可以看做是一个生物神经网络，由众多的神经元连接而成。而下图是人工神经网络中模拟的神经元。每个人工神经元

深度学习

1. 张量（Tensor）的基本概念人工智能领域，往往需要海量的数据处理，此前在机器学习部分,为了便于理解概念,我们一直将数据表示为标量，而实际应用中，数据可能是向量、矩阵、高阶张量。接下来的深度学习中,数据愈发丰富,很多数据是高维的，如图像、视频、音频等。同时,深度学习算法本身也愈加和张量的一

机器学习

在上一篇文章中我们已经了解到GBDT 是一种强大的集成学习方法，具有高准确性、良好的泛化能力和处理非线性关系的优势。但是其仍存在训练时间长、难以并行化和超参数调优复杂等缺点。而XGBT(Extreme Gradient Boosting) 是一种改进的 GBDT，旨在解决上述问题。 1. XGBT

机器学习

1. 残差（Residual）在学习决策提升数之前，我们需要先了解一个基本的概念——残差。残差是预测值和真实值之间的误差。例如，我们要预测一个学生A的成绩，预测值为70，真实值为50，那么残差就是80-50=30。我们可以很容易构建一个残差树：满分100分，学生A成绩70分第一次预测：取满

1 基本概念 Adaptive Boosting(自适应提升)，简称AdaBoost，基于 Boosting思想实现的一种集成学习算法。它通过结合多个弱分类器（通常是决策树桩/decision stump,也就是深度为1的决策树）来形成一个强分类器，从而提高分类性能。弱分类器（Weak Lear

机器学习

1. 基本概念随机森林（Random Forest）由 Leo Breiman 和 Adele Cutler 提出是一种集成学习方法，属于 Bagging 方法的一种代表性实现。主要用于分类和回归任务。它通过构建多个决策树并将其结果结合起来，能显著提高模型的准确性和鲁棒性。算法步骤如上图：数据

机器学习

1. 基本概念现实场景中，在海量数据下，训练一个单一的模型往往会达不到要求，或是过于拟合。基于这样的场景下，集成学习的产生理念就非常朴素。其核心思想是训练多个模型进行预测，互相弥补单个模型的不足。 2. 集成学习的目的简单归纳一下，使用集成学习可以尝试达到以下目的：提高准确性：单个模型可能在

机器学习

在Web开发中，有状态的功能是指那些需要在多个请求之间保持信息或数据的功能。以下是一些常见的有状态功能：用户认证和会话管理：用户登录：当用户登录后，系统需要记住用户的身份，以便在后续请求中识别用户。这通常通过会话ID（如cookie或token）来实现。用户会话：管理用户的活动会话，跟踪用户的

Linux

1 cd 目录切换作用：cd 是英文单词 change directory 的缩写, 其功能为更改当前的工作目录, 也是用户最常用的命令之一。 cd ~ //跳转home目录 cd {tager} // 跳转指定目录 cd ../ //跳转上级目录 cd ./ //当前目录

Linux

1 常见发行版 Redhat: 全球最大的Linux发现厂商，功能全面、稳定，也是Linux内核贡献长年第一名保持者。 Ubutu：普遍认为是Linux桌面系统做的最好的 Centos