原标题:寻找星星、识读甲骨文、给大硅片挑刺,视觉AI妙用还有多少
人工智能技术,正从炫技的AlphaGo,走入我们的寻常生活。以我们常用的人脸识别为例,背后的计算机视觉,是人工智能发展最为深入、应用最为广泛的领域。
在2021年世界人工智能大会上,一批视觉AI的运用案例引发关注。国家天文台运用AI寻找脉冲星;用AI去辨读模糊的甲骨文;AI更在工业领域大放异彩,成为半导体、汽车等高端制造业的质检助手……AI正成为各行各业的“千里眼”。
寻找脉冲星
脉冲星是什么?据新华社此前的报道,脉冲星是一种快速旋转的中子星,由恒星演化和超新星爆发产生,可用于引力波探测、黑洞等相关研究,这有助于解答许多重大物理学问题。
随着2020年1月“中国天眼”(FAST)500米口径球面射电望远镜投入使用以来,让中国的天文研究步入世界前列,尤其是在脉冲星的发现上,提供了更为灵敏和广阔的眼力视野。
但中国天眼FAST每天所捕捉到的信号量极大,每天产生原始数据约500TB,如何从庞杂的信息中精准地识别出脉冲星,业界以逐渐开始使用机器学习、深度学习等人工智能技术。
在2021世界人工智能大会上,腾讯公司董事会主席兼首席执行官马化腾表示,腾讯将和国家天文台联合启动“探星计划”,将AI技术用于寻找脉冲星,探索宇宙。
据腾讯方面介绍,FAST在1周内产生的数据大约相当于3000万张信号图,如果以人工肉眼处理,按照1张/秒速度,在不吃不喝不休息的条件下,需要用一年的时间才能处理。复杂的图像数据如果通过AI预筛选,只需要3天时间就可以完成,将极大的节省人工时间成本。
AI具体如何发挥作用?起流程是:FAST观测到信号,经过一系列天文和物理学方法处理得到适合计算机视觉领域处理的图像数据(如:目标检测与图像分类、小样本学习、迁移学习、神经网络结构搜索、时序多帧信息融合建模、半监督学习),然后对信号进行判别,筛选比对图像数据,留下少部分样本。最后,人工再次对少部分样本进行比对确认。
在7月9日的采访中,FAST首席科学家李菂告诉澎湃新闻记者,与腾讯优图合作以来,已经成功新发现了5颗脉冲星。
识读甲骨文
甲骨文是中国发现的最古老的汉字形式,起源于商代晚期,因刻写在龟甲和兽骨上而得名。
中国历史研究院古代史研究所刘源研究员曾在《甲骨文中的商代文明》讲座中提到,研究商代文明,出土古文字材料方面,除了青铜器铭文、玉石陶器文字等,最重要的就是甲骨文,其数量也多达15万,但是由于时间的隔膜,甲骨文的释读困难重重,“举步维艰”。
现在,甲骨文的识读,AI或许也可以帮上忙。在2021世界人工智能大会上,合合信息公司现场展示了用AI识别甲骨文的能力,其背后是智能文字识别技术,主要包含智能图像处理,基于深度学习的复杂场景文字识别,自然语言处理三个核心技术层。智能图像处理技术主要对用户拍摄的复杂文档图像进行预处理,使得文档图像质量得到大幅度提升。基于深度学习的复杂场景文字识别技术主要利用合合信息自研的手写印刷混排识别,抗强干扰识别,扭曲文字识别,复杂印章和手写识别等一系列先进深度学习识别技术来解决各种不同复杂场景下的文字识别问题。而自然语言处理技术,则是对识别出的结果进行进一步的语义理解。
目前,目前这一技术处于内测阶段,并首次在人工智能大会上展示,安阳殷墟景区为这一技术的学术支持单位。
合合信息相关负责人向澎湃新闻表示:“我们生活中常见的智能文字识别技术,绝大部分针对的是手写或印刷版的现代汉字。甲骨文识别的难点在于甲骨残缺严重、素材难获取、拓片清晰度低等难点,这些都是需要通过技术来解决。例如样本素材少,从技术层面上,我们需要解决少样本训练的问题。目前我们主要是初步研究,更多的工作还在路上。”
给12英寸大硅片挑刺
打破芯片卡脖子问题,推进国产化,一个非常重要的环节是12英寸大硅片的生产,它是芯片生产的原材料。在过去,12英寸大硅片几乎全部依赖进口,近年来,国内企业逐渐开始了产线的建设,打破了国产化率为零的局面。
AI技术的引入,正帮助加速这一领域的国产化进程。众所周知的是,晶圆检测要求极为严格,如果靠人工来检测,效率、准确性远远达不到要求,于是AI就派上了用场。
“硅片检查一般是人在一个暗室里面,用’放大镜’在比较强的光照条件下,不断地翻硅片,不断调整角度。其实对人眼睛的伤害比较大,工作环境也比较差。”思谋科技联合创始人、CEO沈小勇称,“我们看到这情况,就在想为什么不用技术解决这样的问题?”
沈小勇告诉澎湃新闻记者,该公司承担的某国家重点企业12英寸硅片AI视觉检测项目,实现了全线检测的自动化方案,处理速度每片低于0.4秒,提高人力效率96%。
思谋科技以计算机视觉技术起家,主攻的方向是将计算机视觉技术运用于工业领域,创始人为香港中文大学计算机科学与工程学系终身教授贾佳亚与其学生沈小勇。从学者的身份转向业界,意味着手头上的技术不再是空中楼阁,而是应用到了实际的场景中去。
沈小勇称:“我们一定要以产品的方案落地作为最核心的点,因为只要是落地就能实际创造价值。”
思谋希望对标的企业是工业读码和机器视觉公司康耐视(Nasdaq:CGNX),这家在1980年代成立的公司,目前在机器视觉行业市场份额排在全球第一,市值达149.73亿美元。
自去年在上海世界人工智能大会与上海徐汇区签约以来,思谋在上海的团队已达到五六十人,上海及周边发达的高端智能制造业、以及极高的人才密度,正为一批人工智能公司带来广阔的市场和技术的施展空间。