三、组装数据
找到想要的数据在第几行第几列之后,就可以按之前定义的格式写代码提取组装数据啦。
import xlrd
import pprint
book = xlrd.open_workbook('./resource/data.xlsx')
sheet = book.sheet_by_name('Table 9')
# 定义存放数据的字典
data = {}
for i in range(14, sheet.nrows):
row = sheet.row_values(i)
# 取出国家名字
country = row[1]
# 按照给定的格式组装数据
data[country] = {
'child_labor': {
'total': [row[4], row[5]],
'male': [row[6], row[7]],
'female': [row[8], row[9]],
},
'child_marriage': {
'married_by_15': [row[10], row[11]],
'married_by_18': [row[12], row[13]],
}
}
# 最后一个国家是 Zimbabwe,判断到 Zimbabwe 之后就 break 跳出循环
if country == 'Zimbabwe':
break
# 打印数据
pprint.pprint(data)
打印复杂对象时使用 pprint 格式更美观。 |