Google 如何使用模式识别来了解图片内容
计算机“看”照片和视频的方式与人类不同。您在看某张照片的时候,看到的可能是好友正站在自家房前的这一画面。但对于计算机而言,这个画面只是一堆数据而已,这些数据可能会转译为形状以及色彩值信息。虽然计算机在看到该照片时不会有和您一样的反应,但我们可以训练计算机识别某些色彩和形状模式。例如,可以训练计算机识别风景(如海滩)或物体(如汽车)数字图片中包含的常见形状和色彩模式。这项技术有助于 Google 照片对您的照片进行整理分类,并让用户通过简单的搜索即可找到任何照片。
此外,还可以训练计算机识别面孔数字图片中包含的常见形状和色彩模式。这个过程称为面孔检测,并且这项技术有助于 Google 在街景等服务中保护您的隐私。在街景服务中,计算机会尝试检测街景拍摄车所拍摄到的所有路人的面孔,然后对这些面孔进行模糊处理。
更进一步来说,这种可协助实现面孔检测的模式识别技术有助于计算机了解所检测到的面孔特征。例如,有些模式可能会表明脸上带有微笑或双眼紧闭。此类信息可用于协助 Google 提供多种功能,例如 Google 照片的影片推荐功能,以及其他利用您的照片和视频制作的效果。
利用类似技术,Google 照片还可以在某些国家/地区提供面孔特征分组功能,该功能有助于计算机检测相似的面孔并将其分为一组,从而让用户更轻松地搜索和管理他们的照片。在 Google 照片帮助中心详细了解面孔特征分组功能。
语音搜索的工作原理
利用语音搜索功能,您可以向设备上的 Google 搜索客户端应用提交语音查询,而无需手动输入查询内容。该功能利用模式识别技术将语音内容转录为书面文字。我们会将语音内容发送到 Google 服务器,以便识别您说的是什么。
对于向语音搜索功能提交的每条语音查询,我们都会存储相应语言、国家/地区以及系统对语音内容的猜测。我们会保留语音内容以改进我们的服务(包括对系统进行训练,以便更准确地识别搜索查询),但前提是您已同意我们使用此类数据。除非您已表明自己打算使用语音搜索功能(例如,在快速搜索栏或虚拟键盘中按麦克风图标,或当快速搜索栏中表明可以使用语音搜索功能时说出“Google”),否则我们不会将任何语音内容发送到 Google。