Josiah02 发表于 2024-9-18 23:44:13

深度学习推动灰度图像中的动态自动对焦

中国科学院长春光学精密机械与物理研究所的研究人员开发了一种新颖的自动对焦方法,利用深度学习的力量动态选择灰度图像中的感兴趣区域。这项研究发表在《传感器》杂志上。
传统的自动对焦方法可分为主动和被动两类。主动对焦需要依赖外部传感器,成本和复杂度较高。而被动对焦则是通过评估图像质量来控制对焦,但固定的对焦窗口和评估函数往往会导致对焦失败,尤其是在复杂场景中。
此外,缺乏全面的数据集阻碍了深度学习方法在自动对焦领域的广泛应用。传统的基于图像的自动对焦解决方案存在诸如误判光点和焦点呼吸效应等问题,对焦过程中相机变焦和光强度的变化会影响图像清晰度评估。
在这项研究中,研究人员采用三步法来解决这些问题。首先,他们构建了一个全面的灰度图像序列数据集,并不断调整对焦,捕捉从简单到复杂、焦距各异的各种场景。该数据集是训练和评估自动对焦算法的宝贵资源。
接下来,研究人员将自动对焦问题转化为有序回归任务,提出了两种对焦策略:全栈搜索和单帧预测。这些策略使网络能够自适应地对焦帧内的显著区域,无需预先选择对焦窗口。
最后,研究人员设计了一个搭载线性自注意力机制的 MobileViT 网络,这个轻量级但功能强大的网络以最小的计算成本实现动态自动对焦,确保快速准确的对焦。
实验表明,全栈搜索策略在对焦时间为27.8毫秒的情况下,实现了0.094的平均绝对误差(MAE);而单帧预测策略在对焦时间为27.5毫秒的情况下,实现了0.142的MAE,体现了基于深度学习的自动对焦方法的优越性能。
这种基于深度学习的自动对焦方法凸显了人工智能在增强传统成像技术方面的潜力。未来的研究可以探索将该方法应用于彩色图像和视频序列。此外,优化网络架构和对焦策略可以实现更快、更准确的对焦。

页: [1]
查看完整版本: 深度学习推动灰度图像中的动态自动对焦