欢迎来到代码驿站!

Python代码

当前位置:首页 > 软件编程 > Python代码

pandas merge报错的解决方案

时间:2021-11-19 13:21:09|栏目:Python代码|点击:

pandas 做merge的时候报这个错:

df22 = pd.merge(df1,df2,left_on='company_name',right_on = 'name',how='left') Process finished with exit code 137

查了一下原因是:

两个表太大了,可能导致内存不够。

补充:Pandas:merge函数使用注意事项(pandas的merge函数造成大量错误的空值)

相信使用过Pandas的merge函数的人都知道,merge具有连接的功能,左连接更是在数据处理中最常用的连接方式。在使用merge过程中,

经常会出现这种情况:

dataframe1:
a b
1 1
2 2
3 3
dataframe2:
b c
1 2
2 3

dataframe = pd.merge(dataframe1,dataframe2,on='b',how='left')后得到

dataframe:
a b c
1 1 2
2 2 3
3 3 nan

但有时候dataframe2为

b c
1 2
2 3
3 4 

dataframe = pd.merge(dataframe1,dataframe2,on='b',how='left')后得到

dataframe:
a b c
1 1 2
2 2 3
3 3 nan

这是为什么呢?

原因是通常我们的dataframe的数据都是从csv文件或者xls文件读取过来的,在excel中打开对应b那些的数据看起来是一样的,但是使用pandas读取的时候,

可能发现不同csv文件或者xls文件的同一列的数据相同的数据具有整型和浮点型的区别,这样导致在连接的时候,3和3.0是不一样的,无法对3那行进行连接。

因此,在使用merge进行连接前,必须对连接的关键字进行字符化或者整型化的调整。

上一篇:使用python为mysql实现restful接口

栏    目:Python代码

下一篇:使用python判断jpeg图片的完整性实例

本文标题:pandas merge报错的解决方案

本文地址:http://www.codeinn.net/misctech/184005.html

推荐教程

广告投放 | 联系我们 | 版权申明

重要申明:本站所有的文章、图片、评论等,均由网友发表或上传并维护或收集自网络,属个人行为,与本站立场无关。

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ:914707363 | 邮箱:codeinn#126.com(#换成@)

Copyright © 2020 代码驿站 版权所有