自然断点法一般出现在ArcGIS 软件中,进行批量化的操作时,需要将数据导入ArcGIS软件再进行下一步的聚类分析。操作过程较为繁琐,且数据导入过程中容易出现问题。例如数据类型文本、浮点和整形的变换都会影响ArcGIS的分析。
基于excel的python处理可以批量化地解决自然断点的问题,代码如下:(导入文件格式为xlsx,输出文件格式为xls,数据类型统一在python中被转换为浮点型float)
import xlrd
import xlwt
import jenkspy
Table= xlrd.open_workbook(文件路径)
#打印Table相关信息
print(Table.sheet_names())
sheet1 = Table.sheets()[0]
print(sheet1.name,sheet1.nrows, sheet1.ncols)
print(sheet1.col_values(1))
f = xlwt.Workbook()
#遍历Table的每个sheet
for k in range(0,len(Table.sheets())):
sheetSave = f.add_sheet(Table.sheets()[k].name,cell_overwrite_ok = True)
sheet = Table.sheets()[k]
#遍历sheet的列数据
for j in range(1,sheet.ncols):
col = sheet.col_values(j)
List = [float(c) for c in col[1:len(col)]]
ListID = col[1:len(col)]#对类别进行标识
#计算间断点
breaks = jenkspy.jenks_breaks(List,nb_class = 5)
#根据计算的间断点,判断每个原始数据属于哪个类别
for i in range(len(List)):
if List[i] < breaks[1]:
ListID[i] = 1
elif List[i] < breaks[2] and List[i] >= breaks[1]:
ListID[i] = 2
elif List[i] < breaks[3] and List[i] >= breaks[2]:
ListID[i] = 3
elif List[i] < breaks[4] and List[i] >= breaks[3]:
ListID[i] = 4
else:
ListID[i] = 5
print(breaks)
print(ListID)
for u in range(0,len(ListID)):
sheetSave.write(u,j,ListID[u])#写数据
print(j,'------')
print(k,'======')
#保存数据成excel表
f.save(文件路径)









网友评论