谷歌：技术突破，人工智能可以自己看视频了

作者张宇豪在 2015年4月11日

专题

Why Good Content and Google's Hummingbird Update Will Live in ...

随着科技的发展，越来越多的新技术被发现。然而人工智能要想理解真实世界发生的事，可以先从读取视频中的信息开始。Google、Facebook等科技公司都在对图像和语音进行分析研究。

据悉，Google卷积神经网络(CNNs)技术的两位软件工程师在博客上公布了一些研究成果，其中很重要的一个突破是，可初步辨识出动态视频的内容。

他们认为，由于动态视频增加了时间这个维度，运动轨迹等信息丰富，这方面视频反而比图片更易识别和分类。

但对视频而言，不仅要分辨出图像中的物体或人，还要搞清楚他们在干什么。如果想要完整地分析一整段视频(如一场足球赛)，从建模角度来说是个挑战，因为其中很多参数需要调试，计算量大。

为解决这些问题，他们会先提取图像中的大致框架，处理这种相对简单的数据可以降低计算的复杂性。为了防止误差过大，他们以光流法(Optical Flow)的形式观察，也就是相对于观察者的运动所造成的观测目标、表面或边缘的运动来判断。

值得一提的是，该项研究学术论文已经发表。

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据。