数据量太大的时候普通的for遍历实在太慢了
以比较替换为例
需求是要根据各区域用另一个城市表中对应的经纬度做替换
TIM截图20200225190306.png
有几种方法
1、转成np.array处理
cs_data是需要替换的数据
cs_city是各行政区经纬度
'''
cs_data = data2.values
cs_city = df_city.values
for i in range(0,len(cs_data)):
for j in range(0,len(cs_city)):
if cs_data[i][3] == cs_city[j][3]:
cs_data[i][4] = cs_city[j][4]
cs_data[i][5] = cs_city[j][5]
cs_data=pd.DataFrame(cs_data)
cs_city = pd.DataFrame(cs_city)
'''
2.直接pd.merge合并即可,如果是多列的判断,可以把多列进行合并,然后把对照表对应列也合并,这样就都是一列值了,直接merge








网友评论