复杂度分析

讲在之前要说一下几种记号。大O记号，大O记号描述了一个算法最坏的情况。因为是假设n>>2,从而通过n的替换来放大函数（常系数可以忽略，低次项可以忽略），并且相比于原式更加简洁也可以反映前者的增长趋势。这也是我们通常参考的时间复杂度。大Ω记号，大Ω记号描述算法最好的情况，也是假设n>>2，从而通过n的替换来缩小函数，这通常是函数的下界。大θ记号，大θ来描述算法的确切情

2020-09-27

数据结构

数据结构

线性表、栈和队列

线性表线性表指零个或多个数据元素的有限序列。在非空表中每个数据元素都有一个确定的位置，如a1是第一个数据元素，an是最后一个数据元素，ai是第i个数据元素，称i为数据元素ai在线性表中的次序。在较复杂的线性表中，一个数据元素可以由若干个数据项组成。线性表的链式存储结构的特点是用一组任意的存储单元存储线性表的数据元素，这组存储单元可以存在内存中未被占用的任意位置。比起顺序存储结构每个数据元素只需

2020-09-27

数据结构

数据结构

基本数据类型

1.C语言的基本数据类型1.1变量1.1.1变量的解释变量类似一个盒子，你可以先把东西放里面（赋值），等用时再取出来。一个变量“盒子”理论上能放一个任何东西。但是我们需要贴上标签告诉别人这个盒子装的是什么东西（声明）。另外变量“盒子”有点特殊，他只能放入一个东西。如果一个“盒子”里已经有一个东西，但是你又放入了一个东西，原本东西就会被挤出去。所以在c语言中变量的声明和赋值有两种方法：声明并赋值

2020-09-26

C语言

C语言

数据可视化总结

数据可视化指的是通过可视化表示来探索数据，它与数据挖掘紧密相关。总的来说数据可视化能让人们更直观的看到数据的特点。其实数据可视化也是对数据进行处理，只不过是以图表方式来表现的。下面将介绍几种用matplotlib库来实现可视化的方法。数据可视化还有数据描述性统计，就是算出方差，均值，中位数等等。 def des(self,n): def status(x): retur

2020-09-25

机器学习

特征工程

数据预处理方法总结

数据是机器学习的原料，机器学习是通过对数据的训练才得到某种特性的。因此正确的预处理数据对模型结果的输出尤为重要。 -一、数据可能存在的问题数据一开始可能有数据重复，数据缺失，数据存在异常值等情况。二、数据预处理的步骤数据处理主要包括数据的清洗，数据的转化.数据描述，特征选择和特征抽取这几个步骤。 1、数据清洗主要通过对缺失值，异常值和重复数据的处理来完成的。对缺失值的处理首先要判断

2020-09-25

机器学习

特征工程

概率论（下）

二维随机变量二维随机变量概念在同一随机试验E中，称定义在同一样本空间上的两个随机变量X,Y构成的有序数组(X,Y)为二维随机变量。对每个样本点w，有两个实数X(w),Y(w)与之对应且满足：对任意实数x，事件{w|X(w)<=x}都有确定的概率对任意实数y，事件{w|Y(w)<=y}都有确定的概率n维随机变量设随机试验E的样本空间为Ω，X1,X2,…,Xn为定义在Ω上的n个随机变

2020-09-25

机器学习

数学基础

概率论（上）

一些基本概念确定性现象特点：可事前预言或描述非确定性现象特点：事前不可预言，但可能遵循某种规律随机现象：在个别实验中结果出现不确定性，但再大量重复实验中又呈现出规律性随机实验三个特点：重复性；结果明确性；不可预知性随机试验中可能发生也可能不发生的事情称为随机事件。必然事件：随机试验中肯定发生的事情。不可能事件：随机试验中肯定不发生的事件。基本实验：在一次

2020-09-23

机器学习

数学基础