▍前言
AI人工智能近年来成为一个热门而高端的词汇,各个大厂不说自己在做AI都不好意思说自己是个大厂,无论是BAT还是其他科技公司,都基本有自己的AI开放平台,这些AI开放平台的很多功能已经在我们生活中普遍应用;
虽然本意是给开发者用的,但是我们普通人也能够简单上手,用到成本价的服务,现在很多市面上的工具软件,特别是OCR文字识别,图片抠图等,很多都是来自大厂的在线服务,而这些服务大部分都提供了演示功能,方便我们进行测试(白嫖)
。
由于自己之前已经注册并且实名认证过阿里云和腾讯云的账号,这次就主要用这两个平台来测试,百度云很多都没有提供前端的测试功能,更加偏向于开发者
。大厂AI功能一览
各个大厂的AI服务功能基本一致,主要为语音识别合成、图片识别、文字识别、视频处理和机器人等我们普通人用不上的服务。
▍阿里灵杰
▍腾讯AI开放平台
▍百度AI开放平台
大厂AI功能演示
那么这些眼花缭乱的服务到底哪些我们能用的上呢,下面就挑几个大家都能用的上的功能说一说。
▍图片识别处理
这两年出现了很多在线抠图网站,而现在阿里AI就可以直接免费使用
。我特意在百度找了个国外小哥的照片上传测试,效果还是非常不错的,只要背景不是很乱,基本能细到毛发,这个功能是直接打开网页就可以使用的,相对于现在出现的一些在线抠图网站动不动就要下载收费,还很有可能用的是大厂的API,方便太多了。
在AI首页点击进入某一个功能后,会显示阿里达摩院的标志,右上角的能力广场有更多的能力测试。比如各种其他物体的抠图,人脸融合等全套修图美颜服务(修图软件都省了)
。
▍文字表格识别
阿里的文字识别显示的内容带一些返回的数据,不好复制,建议去腾讯AI开放平台进行使用,直接复制排版好的结果,非常方便,特别是腾讯的表格识别,在网页上直接显示的是表格内容,可以复制到excel进行编辑
;
除此之外,你能想到的识别内容都可以进行使用,比如公式识别,票据识别等,目前国内大部分OCR识别工具都是调用大厂的API接口进行服务,现在就是跳过了工具,直接使用最原始的服务,还是免费白嫖的,何乐而不为呢
。
除了网页版提供的服务外,腾讯AI小程序也提供了很多相应的功能,微信可以直接扫码试用,或者微信搜索腾讯云AI体验中心。
▍语音识别合成
目前腾讯和阿里都提供各种语音服务(最出名的讯飞当然也有,本次暂不测试),比如实时语音识别,录音文件识别,文字转语音等,目前我们用的比较多的就是录音转文字和文字转语音,当前网上的很多稍微靠谱点的服务都需要收费,而现在你可以白嫖大厂的语音识别服务,下面以腾讯AI为例:
录音文件识别可以识别电话和非电话内容,电话识别出来是对话的形式,里面有详细的说话时间。按照腾讯云的描述:每个月您可以获得免费额度,该免费额度将以预付费资源包的形式在每月1号自动发放,仅在当月有效,而每个月赠送的都是5个小时以上,基本是可以一直白嫖了
。
上图是我自己电话录音的识别情况,基本识别准确,录音文件识别对一些需要整理会议录音的小伙伴还是很方便的
。
上图为腾讯与相关服务赠送的时长,非常良心。
文字合成音频功能提供了近40种精品音色,基于更优质的算法进行合成,发音更加细腻流畅,大鹏测试感觉还是挺接近真人的,而且有多种声音可以使用,比较可惜的是新用户只可以领取一个免费资源包,内含800万调用字符,有效期为3个月
,但是收费也不贵,试听和合成均按字符数收费,精品音色为0.3元/万字符,标准音色为0.2元/万字符
,就看后面腾讯云怎么调整价格了。
阿里AI也提供了试用版本,但是限制比较多,只能输入300个字符,但是阿里的AI语音模型比腾讯的要多不少,分类也比较详细,功能更强大,如果腾讯不能满足的话可以用阿里的转换,不嫌麻烦的话300字一次的输入
。
提示:大部分功能需要注册账号,还有实名认证,语音服务需要进行开通,选免费或者试用即可,然后进入使用,前期操作稍微有点麻烦。
▍结语
今天主要测试了腾讯和阿里的服务,其他的大厂也提供了很多的功能,有兴趣的可以去试试,都已经归纳在后台了,后台回复AI服务即可获取所有大厂的AI地址,当然你也可以直接百度搜索。
限时特惠:本站每日持续更新5-20节内部创业项目课程,一年会员
只需199元,全站资源免费下载点击查看详情
站长微信:
jjs406