欢迎光临优站分类目录!
当前位置:优站分类目录 » 站长资讯 » 业界资讯 » 文章详细 订阅RssFeed

图普科技:图像识别公有云,能帮我们做决定吗

来源:中华网财经 浏览:371次 时间:2015-09-08

  打开微信朋友圈,大多数人都在晒美食、晒风景、秀恩爱、秀自拍……一图胜千言,时至今日,图像和视频成为了人们记录生活、分享信息的重要手段,也是大数据时代最主要的非结构化数据形态。

  Kleiner Perkins Caufield & Byers曾在2013年大致统计了人们一天上传到网上的照片数量,当时的数值是5亿张,而到了2014年,这个数字变成了18亿左右。

  当人们越来越倾向于选择用图像和视频来记录、分享生活时,如何进行整理、检索和分析的问题就显现了。随着底层硬件、深度学习理论、数据挖掘技术的突破,

  计算机视觉领域在2014年迎来了新的转折点,爆发了一大批优秀的研发团队及创业公司。这些以计算机视觉为本的技术团队,也纷纷度过了艰难的摸索阶段,开始实现商业化应用的落地。

  图普科技就是这样一家成功将计算机视觉技术落地的创业公司——基于深度学习理论,搭建并开放了国内首个图像识别云平台,为用户提供图像识别、图像搜索、深度定制等服务。其产品之一的“内容审核云平台”,便是将图像识别技术进行商业化应用落地的实例。

  读图时代的到来改变了以文字为主的信息传递方式,更多的是依赖各类的图像和视频,而每天产生的海量内容中却又充斥着大量色情、小广告等垃圾信息。健康社交生态的打造,需要高效准确地鉴别和剔除这些违规图片或视频,

  尤其是在UGC领域,保证内容品质、提高用户留存率才能帮助产品获得长期发展。而传统的文字过滤并不能满足内容审核的需求,企业为了规避风险唯有花费大量审核人力,给运营造成不小的压力。

  图普科技的内容审核云平台便是要帮助企业定制自己的图像识别引擎,使用机器来代替人工对图片和视频进行鉴别。企业无需聘请人工智能识别的专家组建研发团队,通过接入API调用识别服务即可。这在极大程度上降低了行业应用图像识别服务的门槛,使得更多互联网企业使用人工智能图像识别技术成为了可能。

  传统的机器识别之所以一直以来得不到广泛认可,最大的问题在于“误判高”。以鉴黄系统为例,虽然之前也有人开发过针对色情图片的识别软件,但机器的识别准确率却一直饱受诟病,以往基于规则的判断方法都是折戟而归。有些软件利用识别皮肤来识别裸体,通过图片中近皮肤颜色的面积占图片比例多少来判断是否裸露,这似乎可行,然而如果遇到一幅手部近距离照片,或是大光头的照片,就会出现识别错误。而在商业场景下,要超过人工98%的准确率,且要有足够高的效率,这就对图像识别技术提出了极高的要求。

  在判断标准上,图像识别云却有着严格而又人性化的判断策略。我们知道,色情与性感的差别往往就在毫厘之间,衣服拉低点露点了就是色情,没露点只是性感,色情图片也越来越艺术,越来越隐晦。不同用户对图片的判断标准有着不同的要求,而图像识别云平台可通过训练不断向符合其自身的判断标准靠近。

  例如,在图普的鉴黄服务中,用户将图片数据上传至云端后,图普的返回参数包括对图片在某个标签下的一个打分,如下图。

  如果打分超过预设的阀值,则分析认为机器的判断有99.5%以上的可能是正确的。

  比如说,鉴别色情图片的三个标签是[色情,性感,正常],假设模型阀值组是[99,98,88.3],这代表当某一图片打分超过99分,机器的判断有99.5%以上的可能是正确的,同理可以理解其他两个分值。

  容易知道,当阀值设置得越高,判断标准越严格,反之亦然。因此,当用户的判断标准和图普机器人不一样,也可以根据返回的分数,找出符合自定义的阀值区间,得到理想的识别结果。

  在实际应用中,图普科技更强调的是机器的可替代性。为了进一步保证让机器识别低于人工的误判率,图普科技创新性地采取了“分割”的办法,对问题进行分割为“确定”和“疑似”的两部分,确定部分非常负责,机器确认的精确度达到99.5%,超越了人工,可以完全替代人力无需复审。疑似部分仅占总图片量的5%-15%,这部分会随着训练次数的增加而不断减少。对于机器无法确定的图片,还会根据概率高低进行排序。这样就大大降低了审核工作量,可以帮助运营团队节省超过90%的人力成本。

  通过图像识别技术,将图片与样本库中的海量样本图进行对比判断,根据判断返回图片的状态,可判断一张图片是否为色情、广告或者正常。对于需要大数据做基础的机器学习而言,公有云成为了最高效的方案模式。每个云端用户只要保持使用,就能为识别模型的持续迭代提供源源不断动力,这对所有用户都是有利的。对于这种方式来说,对比的样本图片越多,分析才会越准确,因此,一个足够大的图片样本库对于垃圾信息过滤的准确性有着重要意义。

  图普科技在做好算法和工程的同时,与国内顶尖云存储供应商七牛云以及国内最大的即时通讯云服务商融云达成战略合作,为其平台上的数十万企业和开发者用户提供图像识别云服务。图像识别云平台还接入了迅雷、花瓣网、酷狗、比邻等众多国内优秀互联网公司,平台的样本数量已经过亿,并且每周会对样本库做一次版本升级,将新识别出的样本加入其中。随着日益增长的数据库,图普的机器学习算法会更加准确。

  目前,图普科技已在多个领域打造了原创性的识别技术,包括色情图像和视频鉴别、小广告过滤、场景与人物识别、暴恐内容过滤等。此外,图普科技同时还提供图像搜索以及第三方图像识别定制服务,从服装风格、人物类别、颜值识别、车牌识别到你能想到的更有趣的技术,都可以交由图普科技进行评估,帮助开发者打造更有趣的应用。

  • 网页咨询