文章目录
- 1 所属领域:水文水资源与数据挖掘技术交叉领域
- 2 步骤分析
- 2.1 提取统计特征量
- 2.2 对2.1中的特征向量,进行均值为0,方差为1的标准化
- 2.3 对特征向量进行聚类
- 2.4 得到N个类别之后,对每个类别降雨场次进行归一化处理,统计每个站点的降雨类型直方图
- 2.5 计算任意两个降雨站点的降雨类型直方图的相似度
- 3 在2.3步骤中的聚类方法介绍
- 4 背景技术介绍
- 4.1 过去对降雨时间序列的研究
- 4.2 本专利的创新点
- 5 具体实施方式
- 5.1 对降雨站点【雨量站】一段时间的数据进行预处理
- 5.2 单场降雨特征的选择和提取
- 5.3 用DBI系数+K-means方法进行聚类
- 5.4 归一化
- 5.5 根据公式,评价任意两个降雨站点的相似性
1 所属领域:水文水资源与数据挖掘技术交叉领域
2 步骤分析
2.1 提取统计特征量
单场降雨的特征向量,包括:单场降雨雨量和、单场降雨天数、单场降雨日平均降雨量、单场降雨日降雨量最大值等等
【计算了一下,应该是9个属性】
2.2 对2.1中的特征向量,进行均值为0,方差为1的标准化
2.3 对特征向量进行聚类
应该是一场降雨,会表示为一行向量,有9个特征,一场降雨就是用这9个特征描述出来。
2.4 得到N个类别之后,对每个类别降雨场次进行归一化处理,统计每个站点的降雨类型直方图
这一步是建立在2.3的基础上的,2.3 会对一个雨量站点的降雨进行聚类,假设得到N个类,每个类可能有x场降雨(也就是说有x行向量,因为一行向量表示一场降雨嘛)。
那么N个类中,每个类的降雨场次是不一样的,先做归一化处理
然后画出这个站点的N个类型的场次,用直方图去表示,(此时就可以看到,哪一个降雨类型包含的降雨场次是多的,哪一个类型包含的降雨场次是少的)
2.5 计算任意两个降雨站点的降雨类型直方图的相似度
是用下面这个公式来计算两个站点的相似度的。
- 我觉得很奇怪: 那么降雨直方图的意义在哪里呢? 这边好像用到的只是降雨场次数目…好的继续往下看…
3 在2.3步骤中的聚类方法介绍
- 这一块先跳过
4 背景技术介绍
4.1 过去对降雨时间序列的研究
(1)降雨预测
(2)极值分布
(3)降水场的时空分布
4.2 本专利的创新点
- 从更细粒度分析单场降雨的统计特征
解释:如果单纯利用年降雨量的累计,而不考虑单场降雨,则无法区分一年内两个站点降雨类型的茶余,更无法区别降雨持续的时间等信息。
针对降雨时间序列不连续的特点,对单场降雨的各种特征进行统计分析,通过研究基于单场降雨的降雨序列相似性,继而研究区域降雨的相似性。
【是个好办法呀!】
5 具体实施方式
5.1 对降雨站点【雨量站】一段时间的数据进行预处理
- 去除重复冗余的日降雨信息
【不懂???】 - 降雨间隔小于两天为同一场降雨,对单场降雨进行划分
5.2 单场降雨特征的选择和提取
非常关键的一步,特征的选择会直接影响到聚类结果的合理性
- 考虑 单场降雨的降雨总量, 反映降雨量
- 考虑 单场降雨的持续天数, 反映降雨持续时长
- 考虑 日降雨量均值, 反映单场降雨的强弱情况
- 考虑 雨量的最大值, 反映单场降雨的极值情况
- 考虑 雨量的最小值, 反映单场降雨的极值情况
根据气象部分规定,暴雨——24h 超过50mm;干旱——24h小于1.27mm