相信你也曾经过这样的尴尬:为了证明自己是自己,你必须提供一大堆卡片,背下一串串密码、口令;一旦这些东西遗失或被篡改,你就不再是”你“了。但是,除了各类身份证件和密码外,每个人独一无二的生物特征也是一种证明方式。
一大早,地铁闸机口,不再用从包里掏出手机,只需轻轻挥一下手,就可通过闸机,到站后挥一下手就可出站扣费;到达办公大楼,也不再需要门禁卡,挥手就可控制大门和电梯;去银行办理业务,也不需要带银行卡和身份证,只要通过手系统便可自动识别你的身份,办理存取款等各种业务。
这些曾经只出现在科幻小说里的场景,慢慢变成了人们触手可及的现实。
但通过指掌纹这种人体生物特征来做身份识别并不是 AI 时代的产物,一千多年前,中国人就深深意识到了每个人的指纹和掌纹的独特。
早在唐朝,人们就开始使用指纹和掌纹作为独特标识用于契书、文书、遗嘱等文件。“大宋提刑官”宋慈在《洗冤录》中详细记载了如何收集嫌疑人指纹断案的实例,也令手印指纹早早就成为中国古代刑事侦破时的重要物证。

01
传统系统急需升级
新一代系统应运而生
建立海量指纹库,需要更高的系统的综合比对性能
传统系统“大库衰减”现象严重
传统系统依赖人工标注,使用门槛高
02
面向 AI 时代的
墨奇智能指掌纹系统
秒级:十亿指纹实时比对
高精度:业界领先的比中率和排前率
自动化比对:墨奇原创无标注特征提取

03
底层技术积蕴提供坚实支撑
首先,先进的数学模型,让高精度、高性能的图像搜索成为可能
传统算法主要依靠细节特征点比对,而指掌纹上除了传统特征点还有很多其他信息,例如纹线的曲率、疏密分布、宏观的走向、拓扑结构等等,以及大量的不能直接用规则描述、但是有区分度的信息,这些都可以被用来区分指掌纹。然而,这些信息分布在不同的尺度上,有的是在像素层级的,有的是指纹整体图像层级的,用人工规则编码的方式来提取这些特征是不现实的,需要有特殊的方法。
墨奇智能指掌纹系统采用人工智能技术来提取多尺度特征,在从像素到整体图像的每一个中间尺度上,都提取了标签、向量和图等不同的特征,使得信息量扩大了上万倍。同时,通过高效的压缩算法,多尺度特征的大小只是传统的数倍就实现了上万倍的信息量扩充。
特征的索引结构也是比对性能的决定性因素之一。系统对多尺度特征分配了不同的索引结构,例如,对于向量特征使用了多种量化索引的特征以支持近似和精确查询。索引在内存中使用列存储的数据结构。对于索引来说,特别是向量和部分的几何索引结构,列存储的性能要显著优越于行存储。索引的内存访问是向量优化的,也就意味着很多的指令可以以批次(Batch)的方式进行,节约了 I/O 和提高缓存效率。

其次,只需要极少样本的自学习框架,让系统可以自学习,且需要的标注数据减少了几千至上万倍
适应多尺度特征的 AI 自学习框架,能够从搜索候选中不断自学习,且单张图片的训练信号大大增加,突破了 feedforward neural network 的瓶颈。
这使得需要的标注数据减少了几千甚至上万倍,且更容易泛化到看不见的数据类别。
另外,超高性能的异构系统和架构,让准确性和速度提升
专门用于视觉搜索的异构多层分布式系统,针对多尺度特征进行了优化,同时提高了搜索准确性和速度。系统比对引擎由一组异构的比对服务器组成,支持CPU、GPU、NPU 等不同的计算单元。引擎将不同种类的特征分配到不同的计算单元上去,在保证准确率的情况下实现加速。在比对过程中,向量和大尺度被首先分配到 GPU/NPU 中去,利用其强大的并行计算能力,对特征进行初步的比对和过滤;对结果使用 CPU 进行几何特征的比对和精确匹配,以及对于多种算法的候选列表进行再排序以优化最终的结果。
秒级搜索数十亿图像的高性能搜索引擎,具备单机高性能 + 分布高容错比对,可以实现海量索引数据分段存储,机群自动扩展和数据自动恢复。同时,利用 NVM 减小了内存消耗,提高了数据密度。

目前,随着科技的不断发展,生物识别技术已被运用到生活的各个场景之中,为人们的生活带来便利,帮助人们以“一手之力”证明你就是你。未来,墨奇科技将继续以技术创新解决行业挑战和客户需求,为数十亿人提供保护隐私、安全可靠的下一代身份识别和认证服务,并研发先进的人工智能技术来自动化地处理机器知识,最终增强人类处理信息的能力。
(文章来源:墨奇科技)