经典机器学习算法的数学推导

news/2024/5/20 8:46:44 标签: 聚类, 机器学习, 人工智能

线性回归

为什么叫h(x)  

为什么用θ表示参数

θ是向量还是矩阵?

为什么用x表示特征

为什么X是一个R^{d}来表示的向量

 为什么在表格添加一列1 ?便于矩阵计算

为什么用\varepsilon表示误差? 

K-means

基础概念:

1.要得到簇的个数,需要指定K值

2.质心:均值,即向量各维取平均即可

3.距离的度量:常用欧几里得距离和余弦相似度(先标准化)

4.优化目标: 就是每个簇内每个样本点到簇中心的距离之和最小

必须掌握的技巧

1.提出常数和取对数

 2.只关注含变量的部分

 3.用向量表示数组

4.转置符号的处理 

5.与对称阵求偏导的相关公式 

XX^{T}是对称矩阵

对于式子 \theta XX^{T}\theta ^{T} 对θ求偏导结果是两倍的对称阵乘变量(2XX^{T}\theta

 6.矩阵求导公式

都是对θ求导:我转你不转,你转我不转

\partial \theta ^{T}X^{T}y = X^{T}y

 \partial \theta X^{T}y = ( X^{T}y)^{T}

7.如何消去一个矩阵

X^{T}\theta -> θ 需要左乘(X^{T})^{-1}

8.如何理解梯度下降 是沿梯度的反方向

因为梯度一般是上升的 为了下山,应该往梯度的反方向走

9.如何理解分别对每个参数分别优化

因为所有的前提是独特征立的,既然特征是独立的,那么特征的系数(参数)也可以认为是独立的

10.只关注需要求偏导的变量的部分

对 \theta _{j}求偏导,那么其他\theta x的结构都是常数项,只有x_{j}\theta _{j}有关

 

必须记住的表示方法

1.用求和形式表示多项式,偏置项合并到关于θ的向量里

2.让损失函数越小越好

3.\varepsilon是独立并且具有相同的分布 服从均值为0,方差为θ^2的高斯分布

   \varepsilon为什么是独立的? 误差是由样本产生的,而样本之间是独立的

   \varepsilon为什么是同分布的?因为默认样本是同批产生的

   \varepsilon为什么服从的是高斯分布?

    θ是矩阵还是数值?

    高斯分布和正态分布的关系?

    为什么用高斯分布来表征?因为偏离均值特别多的值很少出现

4.高斯分布与多元高斯分布的数学表现形式

高斯分布

p(\varepsilon )=\frac{1}{\sqrt[2]{2\pi }\varepsilon }exp(-(\varepsilon -0)^{2}/2\sigma^{^{^{2}}}))

\varepsilon是均值

\sigma是方差

5.多元高斯分布

线性回归误差的高斯分布

得到线性回归误差的高斯分布是

        p(y|x;θ)越大越好

 6.似然函数

似然函数有什么用?就是描述什么样的参数和特征值组合后是真实值,所以似然函数都是越大越好

为什么似然函数是连乘的形式?因为默认误差是独立同分布的,所以联合概率分布是可以拆成各自概率分布连乘

 

        


http://www.niftyadmin.cn/n/1714751.html

相关文章

java仿QQ通信项目实现二

java仿QQ通信-(客户端) 上一节我们实现了通信服务器端,这一节我们一起来完成客户端的代码。 将客户端封装为一个类: 首先每个客户端有一个Socket连接对象。假如我们要和服务器建立一条通信管道,这个对象将是客户端接…

自然语言处理面试题

tfidf tf是啥?词频 idf是啥?逆词频 max_df 选择词频的上界 min_df 选择词频的下界 max_features 选择的最大特征数 利用sklearn tfidf实例 导包 from sklearn.feature_extraction.text import TfidfVectorizer 实例化 word_vec TfidfVectori…

java仿QQ通信项目实现三(服务器端与客户端连接断开的流程)

在这一篇我们来实现剩余的消息类型之一:退出消息 1.退出消息 格式: totallen13(消息头)提示消息长度(String) type0x20 dest为0手动退出,为1异常断开 src为0客户端主动断开,为1服务端主动断开 notice(Strin…

java仿QQ通信项目四(客户信息和客户端获取好友列表)

java仿QQ通信项目四 项目文件:https://pan.baidu.com/s/1qgNglEC6eWHOlmnp3Hz2Yg 提取码:a6t6 我们在使用QQ时,都拥有自己的资料卡,我们还有自己的好友列表,还可以添加好友,删除好友,下面我们…

算法设计与分析常见思路和模板

计算时间复杂度的必备技能 1.判断循环什么时候结束 2.观察函数被调用了多少次&#xff08;适用于递归&#xff0c;动态规划问题&#xff09; while i < n:ii*2 while i < n:iii 实在不行举个例子&#xff0c;i1,2,4,8,2^m 递归解题模型 原则&#xff1a;先写递归出…

C/C++堆栈的区别

1.一个由C/C编译的程序占用的内存&#xff1a; ①栈区Stack 函数参数&#xff0c;局部变量等 ②堆区Heap malloc new 自动申请的内存 ③全局区&#xff08;静态区&#xff09;Static BSS区 没有初始化或初始化位0的全局/静态变量Data区 初始化的全局/静态变量&#xff08;非co…

算法设计与分析速成

1.递归方程的求解迭代展开&#xff1a;迭代展开递归方程 注意&#xff1a;每一项内的值不能出现负数或0 比如T&#xff08;n-1&#xff09;则 n >1 i则 <n-1 换元迭代&#xff1a; 递归树表示&#xff1a;迭代展开的可视化表示 假设归纳&#xff1a;先假设&#xff0…

计算机视觉的基本面试题

1.描述图像大小&#xff0c;通道数&#xff1f; 长&#xff1a;331 宽&#xff1a;500 通道数&#xff1a;3 2.img[:,:,0]的含义 0&#xff0c;1&#xff0c;2表示图像的RGB通道 3. 如图的iread设置参数0的含义&#xff1f; 就是读取灰度图像 4. 如何让该图片颜色显示正常…