三、组装数据
找到想要的数据在第几行第几列之后,就可以按之前定义的格式写代码提取组装数据啦。
- import xlrd
- import pprint
- book = xlrd.open_workbook('./resource/data.xlsx')
- sheet = book.sheet_by_name('Table 9')
- # 定义存放数据的字典
- data = {}
- for i in range(14, sheet.nrows):
- row = sheet.row_values(i)
- # 取出国家名字
- country = row[1]
- # 按照给定的格式组装数据
- data[country] = {
- 'child_labor': {
- 'total': [row[4], row[5]],
- 'male': [row[6], row[7]],
- 'female': [row[8], row[9]],
- },
- 'child_marriage': {
- 'married_by_15': [row[10], row[11]],
- 'married_by_18': [row[12], row[13]],
- }
- }
- # 最后一个国家是 Zimbabwe,判断到 Zimbabwe 之后就 break 跳出循环
- if country == 'Zimbabwe':
- break
- # 打印数据
- pprint.pprint(data)
打印复杂对象时使用 pprint 格式更美观。
|