从2014年开始,谷歌就开始了在AI识别图像项目上的研究。经过长时间的研究,现在谷歌推出了最新的AI识别图像系统,该系统能够识别图像中的内容,并且配上相应的文字,经过测试,谷歌推出的这套AI系统能够描述图像的准确率达到93.9%。
近日,谷歌发布了最新版机器学习系统,通过识别图像中的内容,配上对应文字,效果达到了历史最佳。谷歌已经在 TensorFlow 上开源了这项成果。自 2014 年以来,谷歌一直致力于这个项目,现在这个算法描述图像的准确率已经高达 93.9% 。因为他们正在使用一个开始架构的最新的迭代,所以对于谷歌团队来说,有个大问题是该算法是否可以做的比简单识别图像中的对象更多。
要真正解释和描述一张照片,人工智能不仅需要了解图片中是什么,更要了解图像中这些对象有什么相互关系。谷歌的开发人员表示这不只是一个数据的倒推。该算法必须能够自然地理解图像中的对象和它们的用途。
谷歌研究的博客发文说:“令人兴奋的是,在展示全新情境时,我们的模型的确可以产生准确的配文,这显示出系统对图像中目标和背景的理解更深了。”同样重要的是,“它还学会了如何表示知识在自然的英语短语,尽管它只读了人类给的说明字幕,没有在接受其他额外的训练。”
至少从目前来说,相对于视频,机器学习算法能更好地理解静止图像的内容。
有些用户认为AI识图系统早就有其他公司推出过,其实谷歌的这款识图系统和之前的有些不同。谷歌的AI识图系统不但要识图,还要查找图里面的其它事物,包括多个物体之间的联系、位置等信息。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
本文地址:/google/2021-03-07/12243.html