原标题:港媒关注:中国构建全球最大卫星图像数据库 来源:参考消息网
参考消息网5月6日报道 据香港《南华早报》网站4月30日报道,中国科学院4月28日说,中国发布了包含100多万个目标详细信息的卫星图像数据集,用以帮助减少人工智能从太空识别物体时所犯错误。
中科院说,遥感图像细粒度目标识别数据集(FAIR1M)比其他国家使用的类似数据集要大几十倍甚至上百倍。
中国科学院空天信息创新研究院FAIR1M项目首席科学家付琨教授说,人工智能卫星图像识别训练中数据库相对较小影响了实际应用的准确性。
报道称,近年来,人工智能技术的迅速发展使平民能够从商业卫星图像中获取有价值的信息。
例如,清点一座城市乃至一个国家公路上的货车数量就能了解其经济活动、交通运输和基础设施。
报道指出,中国的一些研究人员利用这项技术追踪新疆的城市扩张速度、青藏高原的野生动物行踪以及“一带一路”倡议下的全球基础设施建设。
然而,现有的人工智能算法有时难以识别卫星图像中的物体。大多数民用工具都是使用日常生活中拍摄的照片进行训练的,但比如说,游客拍摄的埃菲尔铁塔照片与卫星从300公里高空拍摄的照片有着天壤之别。
报道称,训练用的数据库越大,人工智能就会变得越聪明。但是,由于卫星图像、尤其是高清图像的数量相对有限,有时还相当昂贵,民用人工智能的准确度一直很低。
报道指出,在中国国家自然科学基金的资助下,借助全新的“高分”观测卫星,付琨和同事们构建了一个包含超过1.5万幅图像、覆盖100万个带标注“场景”的高清卫星图像数据集。法国的VEDAI数据库只覆盖约3600个场景。
中科院网站宣布,中国的整个数据集将于6月向国际社会开放。总部设在德国的国际摄影测量与遥感协会已将它作为评估物体识别算法好坏的标准数据集。
FAIR1M提供了更多关于图像的信息。例如,其他数据库仅仅将客机描述为飞机。中国的这个新数据库可以教人工智能识别飞机的准确型号,比如波音777,或者让它区分军舰与客轮。
据报道,此前中国人工智能图像识别技术的发展主要依靠其他国家的数据库。现在,中国拥有了世界上两个最大的卫星图像数据集,在该领域取得或保持领先地位的概率更大了。
报道称,过去,收集卫星图像的大多是西方国家。近来,中国搭建了全球最大的地球观测网络之一,其“高分”系列等卫星搭载了尖端摄像头和传感器。
付琨团队说,FAIR1M数据集80%以上的图像来自中国卫星,其余的来自谷歌地球。它们包括车辆、挖掘机等机械以及桥梁、围场和棒球场等建筑物。