微软要用人工智能识别照片人物的情感

　　11月11日，在伦敦举行的微软未来解码大会上，微软剑桥研究院主任Chris Bishop公布了微软「牛津计划」最新的接口服务——通过照片识别出人物的情感。

　　这个新服务的功能还不止如此。本周早些时候，微软为十一胡子月(Movember)男性健康慈善活动更新了人脸识别的API。这个活动号召男性在每年11月份都不要刮胡子，以引起全世界对男性健康的关注。这个新API可以识别出你胡子的浓密程度，并打分，贴上标签。

　　这些好玩的应用，都建立在微软「牛津计划」强大的机器学习能力上。牛津计划(Project Oxford)是一个炫酷的服务，它提供了一组工具包，能帮助开发者使用微软的自然数据理解能力为自己的解决方案增加智能服务。这个计划于2014年首次推出，包括了人脸识别、语音识别、计算机视觉、语言理解智能服务四大部分。微软的人工助理服务Cortana和Skype翻译服务(能实时翻译50种文字和6种语音)都是基于这项技术。因此，一经推出就受到了从500强到初创公司的欢迎。

　　如果视频无法播放，点击这里试试

　　而今天，微软对该计划进行了更新，加入了新内容，并正式公布了公测版本。这个新版本能够帮助开发者更好地使用服务——其中最引人注目的就是情感识别。微软在一篇博客中公布了这个新API的细节：

　　情感识别：基于微软的Azure云服务，用标记了人类情绪的图片数据集进行过训练。它能够识别出图片中任何一张人脸的情绪。这个服务在图片上使用元数据，能够识别图上绝大多数人物是悲伤还是快乐，还能用在识别人们对特定事件(如展览、市场信息等)的反应。

　　拼写检查：基于Web API，能够集成入任意移动或云端应用，不仅能识别出拼写错误，还能识别大小写错误、语境拼写错误以及其他问题。由于它在云端，所以永远不用升级，并能继续学习。

　　视频加工：基于微软的Hyperlapse视频处理工具的技术，这个新API将在年底前进行测试。它能够处理巨量的视频数据，识别出视频中的单个人脸并进行追踪。它还能根据一组参数检测出视频中人物或物体的行动——包括对视频进行图像稳定处理，以消除摄像机移动所造成的影响。

　　说话者识别：目前，牛津计划已经能够轻易地将语音转换为文字，但是这个新的说话者识别技术(今年年底开始测试)将能允许应用程序识别出究竟是谁在说话。微软高级项目经理Ryan Galgon介绍说，这个服务将不会取代更强的验证工具，但是它能识别出使用者身份的变化，能够增强验证工具的有效性。对安全要求不那么高的应用，它可以用来识别用户——例如，识别电话会议中是谁在说话。

　　智能识别定制服务（CRIS）：这个工具目前已经进行封闭式测试。它允许开发者构建对语音识别功能要求更高的应用程序。例如，可以用在体育馆中的语音识别，那里有大量混凝土墙围绕的空间，欢呼声和背景噪声十分嘈杂，使得普通的语音-文字引擎无法正常工作。

　　除了识别胡子，微软的性别年龄检测能力也有了极大提升，还在人脸识别应用接口中加入了微笑检测工具。

推荐资讯

推荐站点

最新收录

QQ咨询

电话咨询

新版调查