苏黎世联邦理工学院Nat. Sustain.: 机器学习用于监测全球发展援助

苏黎世联邦理工学院Nat. Sustain.: 机器学习用于监测全球发展援助
发展援助在帮助发展中国家实现可持续发展目标(SDG)方面发挥着至关重要的作用,其监测为决策者资助SDG提供了重要证据。然而,现有的全球发展援助监测存在相当大的局限性,导致极其困难和昂贵。一个主要原因是全球援助体系结构高度分散,其中不同的捐助者为不同受援国的大量援助活动提供资金。
苏黎世联邦理工学院Nat. Sustain.: 机器学习用于监测全球发展援助
为此,瑞士苏黎世联邦理工学院Malte Toetzke等人开发了一个机器学习框架,该框架能够根据经济合作与发展组织(OECD)的债权人报告系统(CRS)中提供的捐助者文字描述对发展援助活动进行全面而细致的分类。
具体而言,数据包含在2000年至2019年间进行的约320万份援助活动的文字描述,由757个不同的捐助组织资助,总支出为3.2万亿美元。作者将这些活动的文字描述聚集成173个活动集群,其中70个活动集群涵盖了尚未进行实证分析的主题(如温室气体减排和孕产妇保健)。
此外,该机器学习框架遵循自下而上的方法,在生成分类之前对所进行的援助活动的所有文本描述进行处理。这与现有监测中自上而下的方法形成鲜明对比,在这种方法中,标准化标签必须事先预先确定,然后分配给新的援助活动。
苏黎世联邦理工学院Nat. Sustain.: 机器学习用于监测全球发展援助
图1. 机器学习框架生成的活动集群概览
该框架包含3个主要步骤:首先,输入是所有援助活动的文本描述,它们被嵌入到200维向量空间。在这个空间中,具有相似主题的活动描述彼此接近,而不同主题的活动描述则更远。其次,活动描述的文档嵌入被聚类以将具有相似主题的活动分组到同一类别中。最后,分析每个集群的内容并为集群提供名称。
这种机器学习框架的自下而上方法带来了三个重大优势:首先,该框架确保了援助主题的准确表示,并使分类适应新兴主题(如青年赋权、小额信贷)。其次,该框架通过算法对数以百万计的个人援助活动进行分类,从而确保对援助活动的解释具有一致性。第三,该框架产生了高粒度的援助主题,因此可以更精确地分解发展援助。
总之,这项研究在推进可持续发展领域的数据驱动分析方面迈出了重要的一步,可对全球援助活动进行更具成本效益、更细粒度和更全面的监测。
苏黎世联邦理工学院Nat. Sustain.: 机器学习用于监测全球发展援助
图2. 分配给受援国发展援助的全球分布
Monitoring global development aid with machine learning, Nature Sustainability 2022. DOI: 10.1038/s41893-022-00874-z

原创文章,作者:v-suan,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2023/10/14/058bb0354b/

(0)

相关推荐