pandas怎么将表中的字符串转成数值型 |
您所在的位置:网站首页 › html字符表 › pandas怎么将表中的字符串转成数值型 |
pandas怎么将表中的字符串转成数值型
发布时间:2023-02-22 15:04:18
来源:亿速云
阅读:96
作者:iii
栏目:开发技术
今天小编给大家分享一下pandas怎么将表中的字符串转成数值型的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。 pandas将表中的字符串转成数值型在用pd.read_csv读数据时,将要转换数据类型的列名和类型名构成字典,传给dtype import numpy as np import pandas as pd path = 'house_data.csv' col = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV'] dict_dtype = {} for i in col: dict_dtype[i] = np.float64 # print(dict_dtype) data = pd.read_csv(path, header=None, names=col, sep=',', dtype=dict_dtype)扩展:pandas 把某一列中字符串变数值_Pandas对文本数据处理在处理数据的时候,对数值型的数据处理还是比较方便的,但是有时候数值型数据出现问题后就会比较头痛了,因为文本数据的排列组合可是有很多很多的,今天我们就学习一下如何对文本数据进行处理,这样我们接下来在工作中遇到了这些情况就可以少掉一下头发啦。 一、str属性文本数据也就是我们常说的字符串,pandas为series提供了str属性,通过它可以方便对每个元素进行操作。 为了防止数据被弄坏,我们先预留一个备份以防万一。 这里我们是不能使用backup_user_info = user_info的因为这样的话一个更改另外一个也会更改。 在之前我们也已经了解过,在对series中每个元素处理时,我们可以使用map或apply方法,比如我们想把星球列下面的地球和外星转换为英文,可以使用下面的方式。 这时候我们在将表恢复成原来的样子。 将哪个星球列下的星球改为大写的英文后再改为小写 首先更改为英文 然后设置一个函数,将星球改为大写,原理为upper()方法 然后在设置为小写,原理为lower方法 给英雄们的身高加上一个单位 我们通过str属性来访问之后用到的方法名与 Python 内置的字符串的方法名一样。并且能够自动排除缺失值。 我们再来试试其他一些方法。例如,统计每个字符串的长度。 将cm替换成空白的字符串 将身高列的元素类型转换为整数型 生成一个新的列,列名为姓名的长度,元素为英雄姓名的长度(len方法) 查看表的元素类型 将年不年轻列的中的中年属性更改为中老年属性 查看城市列中每个元素有几个字 查看年不年轻列中每个元素是否有轻这个字符串 二、替换和分隔使用.srt属性也支持替换与分割操作。先来看下替换操作,例如:将大写的R转换为小写的r。 将列中的数据进行分隔 将是否年轻按年进行分隔,结果如上所述。 分割列表中的元素可以使用 get 或 [] 符号进行访问: 比如说电影的主演有很多人, 可能是用逗号, 或者/ 进行分割, 这是可以用这种方法转换成列表 在表中添加一列英雄的爱人列 将爱人列以,号分隔 这时候就可以让某一行的这个元素以列表表现出来。 将索引列改为英雄姓名,并查看蜘蛛侠和灭霸的爱人 三、提取子串既然是在操作字符串,很自然的大家可能会想到是否可以从一个长的字符串中提取出子串。答案是可以的。 1、提取第一个匹配的子串extract方法接受一个正则表达式并至少包含一个捕获组,指定参数 expand=True可以保证每次都返回DataFrame。例如,现在想要匹配空字符串前面的所有的字母,可以使用如下操作: 查看哪位英雄的所在的星球包括E这个字符串 查看哪位英雄所在的城市包括纽这个字符串 四、生成哑变量首先我们先了解一下什么是哑变量: 哑变量原名为虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且接近现实。 在pandas中我们可以通过get_dummies 方法可以将字符串转为哑变量,sep 参数是指定哑变量之间的分隔符。 对英雄姓名进行哑变量转换 从结果可以看出,第0行的英雄姓名是蜘蛛侠,第1行的英雄姓名是灭霸,哑变量转换就是将每一个选择匹配哪一行的数据。 对那个星球进行哑变量转换 从结果可以看出,在地球的英雄是第0、2、3、4、6行的,对应的英雄名称为(蜘蛛侠、奇异博士、钢铁侠、蝙蝠侠、黑寡妇) 以上就是“pandas怎么将表中的字符串转成数值型”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注亿速云行业资讯频道。 推荐阅读: 用一块荣耀智慧屏,组成未来世界的万花筒 Vue-Router路由怎么配置免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:[email protected]进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。 panda 上一篇新闻:Python字符串类型及格式化问题怎么解决 下一篇新闻:SQL怎么按照年月来查询数据问题 猜你喜欢 如何解决使用openpyxl时遇到的问题 分析openpyxl库,遇到批量合并单元格的问题 python 如何用pandas同时对多列进行赋值 django中的*args 与 **kwargs用法是什么 C# 枚举如何使用 如何解决python3.6 右键没有 Edit with IDLE的问题 django views如何重定向到带参数的url Django中url与path及re_path有什么区别 Django URL和View的关系是什么 C# 怎么通过ServiceStack 操作Redis |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |