机器学习:Jupyter Notebook中numpy的使用

您所在的位置:网站首页 jupyternotebook魔法命令 机器学习:Jupyter Notebook中numpy的使用

机器学习:Jupyter Notebook中numpy的使用

2023-09-25 09:09| 来源: 网络整理| 查看: 265

一、Jupyter Notebook的魔法命令

 # 模块/方法 + ?或者help(模块/方法):查看模块/方法的解释文档;

 1)%run

 # 机械学习中主要应用两个魔法命令:%run、%timeit

 # 魔法命令格式:% + 命令

 # %run:将模块引用并在Jupyter Notebook中执行(这是与import的区别),模块被引用后,其内部的函数可以在Jupyter Notebook中直接被引用;

 # 格式:%run + 文件的地址 + 文件名

 

 2)%timeit 测试代码的性能,后面只能接一条语句/代码块,得出运行此条语句或代码块所用的时间; %timeit + 一条语句:测试该条语句运行所用时间; %%timeit:表示测试在该单元格内的全部代码运行时所用时间; %timeit、%%timeit,一般是将代码运行多遍,然后去取执行最快的几次的平均值; 如果%timeit和%%timeit后面的代码,每次运行的效率不同,则测量的结果又偏差; %time,返回只将代码运行一遍所用时间;但这样的测试结果不稳定,每次测得结果差异很大,但对于一次测试用时较长的代码/算法,测试差异可以忽略;

 

 3)其它 命令 + ?:查看命令的文档; 可以通过%lsmagic查看素有的魔法命令; 机器学习算法中,scikit-learn中的函数封装的都是接收一个Numpy的矩阵,通常使用Pandas对数据进行预处理,将Pandas数据转换为Numpy的矩阵,再送给机械学习的算法;

 

二、numpy.array基础  1)numpy.array的基础 python的list数据非常灵活,运行效率较低,因为系统需要检测其中所有数据的类型; Python中的array模块,可以限定只存储一种数据类型: import array arr = array.array('i', [i for i in range(10)]) # 其中'i'表示数据类型为整数 print(type(arr[5])) # 5 arr[5] = 'a' # 报错,arr内的数据只能赋值为整数 Python的array模块缺陷:1)中没有将数据看成向量或矩阵,因此也没有向量和矩阵相关的运算;2)只有一种数据类型,不够灵活使用; numpy模块的array方法,可以进行向量和矩阵的运算; numpy模块的array方法创建的数据,只能是整数,若将小数赋值给array方法创建的数据时,会自动转换为整数; 机械学习中所操作的大多数数值为浮点数;

 

 2)np.array的创建   A、创建全0数组 np.zeros(10):默认为float64类型的一维全0数组; array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]) np.zeros(10, dtype = int):数据类型为int的一维全0数组; array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0]) np.zeros((3, 5)):默认fioat64类型的3行5列的矩阵; array([[0., 0., 0., 0., 0.], [0., 0., 0., 0., 0.], [0., 0., 0., 0., 0.]]) np.zeros(shape = (3, 5), dtype = int)或者np.zeros( dtype = int, shape = (3, 5)):类型为int的3行5列的矩阵; array([[0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0]])      B、创建全1的数组 np.ones(),操作方法同理全0矩阵的创建;      C、创建所有值都相同的数组 np.full((3, 5), 666)或者np.full(shape = (3, 5), fill_value = 666)或者np.full(fill_value = 666, shape = (3, 5)):默认为int; array([[666, 666, 666, 666, 666], [666, 666, 666, 666, 666], [666, 666, 666, 666, 666]]) np.full(10, 666)或者np.full(shape = 10, fill_value = 666)或者np.full(fill_value = 666, shape = 10): array([666, 666, 666, 666, 666, 666, 666, 666, 666, 666])      D、numpy中arange的用法:参数的用法与python中range的参数用法一样 np.arange(0, 10):默认步长为1; array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) np.arange(10):默认起始值为0,默认步长为1; array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) np.arange(0, 10, 2):取值间隔为2; array([0, 2, 4, 6, 8]) np.arange(0, 1, 0.2):步长可以为小数,0.2,而python中的range的参数,步长不能为小数; rray([0. , 0.2, 0.4, 0.6, 0.8]) range()生成列表,np.arange()生成数组;        E、numpy中linspace的用法,与arange类似 np.linspace(0, 20, 10):将0~20间的数等分10个点,首尾分别是0和20,此处10不是步长,而是将区间等分的点数(包含首尾数值); array([ 0. , 2.22222222, 4.44444444, 6.66666667, 8.88888889, 11.11111111, 13.33333333, 15.55555556, 17.77777778, 20. ])      F、numpy中random的用法:生产随机int数random.randint() 区间为前闭后开:[m,n); 随机生成的数据给算法时,运行的结果不一致,导致调试困难; 计算机中,所有的随机数都是伪随机数,都是随机算法实现的;推动算法生产随机数的是随机种子:同一个随机种子生产的随机数是一定的,再次调用该种子时可以得到上一次该种子生产的随机数; np.random.randint(0, 10):从0~10间随机生产一个z 5 np.random.randint(0, 10, 5):从0~10间随机生成5个int类型的数; array([8, 6, 3, 3, 6]) np.random.randint(4, 8, size = 10):一般标出size = 10,提高代码可读性; array([6, 5, 6, 7, 4, 7, 7, 6, 5, 5]) np.random.randint(4, 8, size = (3, 5)):从[4, 8)中,随机生成3行5列的矩阵; array([[7, 7, 5, 5, 5], [5, 7, 5, 7, 4], [6, 6, 4, 6, 5]]) 随机种子的使用 # Jupyter Notebook中实现的代码 np.random.seed(666) np.random.randint(4, 8, size = (3, 5)) # 设定随机种子,并生成随机数据 np.random.seed(666) np.random.randint(4, 8, size = (3, 5)) # 再次调用该种子,并再次生成原来格式的随机数据,所得到的数据与第一次随机生成的数据相同;

 

  G、numpy中random的使用:生成随机float数random.random() 生成的float数为0~1的随机数; random.random()的操作格式与random.randint()一样;        H、numpy中random的使用:


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3