原标题:400+条猫咪叫声被做成数据集,可识别猫咪的3种不同状态
萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI
这年头,就连喵星人也有自己的语音数据集了。
画风是这样的:
没错,来自米兰大学计算机系的几位猛男,和生物系、兽医系的小伙伴们一起,收集了21只猫咪的400+条语音数据,做了个猫叫声数据集。
这21只猫咪中,包括10只成年缅因猫和11只成年欧洲短毛猫,是长毛和短毛猫咪中的代表类型。

3种猫咪叫声,总长21分钟
制作这个数据集的初衷,是为了人类能更好地理解猫咪叫声的含义,为以后的人-猫沟通作准备。
因此,在制作数据集时,研究者们选择了3种让猫发出不同叫声的场景:
等待投喂:主人喂食前的猫叫声。
被放到陌生环境下隔离:将猫运送到一个陌生环境,车程不超过半小时,被隔离前会与主人先相处半小时。隔离时的猫会发出叫声。
刷牙:主人给猫刷牙时的猫叫声。
在这些场景中,每次收集猫叫的时间不超过5分钟(例如,5分钟后就会给猫喂食)。
为了让语音数据更清晰、且不影响猫的日常行动,研究者们采用了一个不到50g的小型麦克风,挂在猫脖子上。

无关猫咪种类,识别效果90%以上
研究者们采用了模式识别的方法,算法框架是一个有向无环图。
简单来说,先区分猫叫声是否属于“等投喂”和“被隔离”两种状态,再识别它们是否属于“刷牙”的状态。




发现这个数据集后,不少网友第一反应:居然连这都有?




猫叫数据集传送门:
https://zenodo.org/record/4008297#.YNFSEhMzaPf