8月23日,美国新闻网站Quartz报道称,谷歌正在研发一项新技术,利用现代人工智能的基础材料——人的神经网络,对图片进行压缩,在确保图片质量的基础上,大大缩小图片文件的体积,其效果将优于JPEG。
对于消费者来说,图片体积被压缩意味着,用户可以释放更多手机、平板和电脑等设备上的存储空间。但这对于谷歌这种提供无限量网络存储空间的科技公司来讲,照片如果被压缩,节省的就是服务器负载和用电量,传输速度也能得到提高。
这项技术的基础原理是:AI通过看大量图片的压缩模式来学习如何进行压缩工作。当其完成学习过程开始工作时,看到一张图片,就会像人脑神经一样呈现出图片压缩后的状态,随即生成该图片的压缩版。压缩过程中,图片被AI分成碎片化的小块来分散选择最佳压缩方案,而不是一张完整的图片按照固定的程式统一压制,因此AI压缩所得的图片能够保证质量的最优化和体积的最小化。
据谷歌团队发布的一篇论文描述,谷歌研究人员利用600万张互联网上随机挑选的照片,向人工智能系统展示图片的标准压缩过程,以训练人工智能系统,教会神经网络如何压缩并保存数据。
研究人员将600万张随机选取的压缩照片分解成32×32像素的小块,然后挑选出其中压缩效率最低的100个小块让系统去学习。谷歌的想法是:通过难度大的小块进行训练,图像其他部分的压缩将会变得更容易。
研究人员将已压缩的照片分解成32×32像素的小块,挑选出其中压缩效率最低的100个小块让系统去学习
论文还显示,神经网络在标准测试过程中,表现优于标准的JPEG压缩。因为人工智能系统会预测图片压缩后样子,然后生成这一图像。这一系统与现行的压缩方式最大的不同之处在于,神经系统能够决定压缩一张图片不同部分的最佳方案,以及这些部分怎样拼到一起比较合理,而不是把整张图片看做一个整体来压缩。
谷歌在这方面的研究成果今年早些时候就通过论文形式发表,但之前的研究不能证明该方法对小于64×64像素的图片有效。而新的人工智能则不受图片大小的限制。
JPEG和谷歌AI压缩图片的效果对比,左:JEPG,右:谷歌AI
不过,谷歌团队也坦言,这并不意味着这项人工智能技术已经成熟到可以被应用到包括“谷歌照片”在内的产品中。被压缩后的图片有时用肉眼看起来并不完美,目前也还没有标准化的方法去进行测试。
但这个概念一旦被纳入实际应用,我们能够想象的未来就是,无论你的手机里装了多少照片,它们所占的空间大小都将不再是问题。