本文总共1024个字,阅读需4分钟,全文加载时间:2.171s,本站综合其他专栏收录该内容! 字体大小:

文章导读: 大家好,超子能力有限,技术不高,有什么错误的地方,欢迎板砖。超子今天给大家介绍一下,如何使用腾讯云的录音文件识别功能,将mp3,wav等音频文件转成文字,我们需要4步走。 1.开通腾讯云录音文件识别功能,每……各位看官请向下阅读:

大家好,超子能力有限,技术不高,有什么错误的地方,欢迎板砖。超子今天给大家介绍一下,如何使用腾讯云的录音文件识别功能,将mp3,wav等音频文件转成文字,我们需要4步走。

1.开通腾讯云录音文件识别功能,每月累计30小时的免费额度。

2.开通对象存储 COS 服务,开通后6个月免费。

3.音频文件上传到对象存储服务上,识别的时候,腾讯云会从对象存储获取音频文件。

4.使用腾讯云API调试助手,调用服务器接口,完成识别请求。

先看第1步,我们登录腾讯云官网,首页产品类目下,选择人工智能大类目下的语音技术,语音识别服务,音频录音文件识别就是这个服务下的功能。

接着进行第2步,还是官网首页产品下选择热门,然后选择对象存储。

我们开通服务,然后立即使用,首次开通后,6个月免费。

然后是第3步,我们进入对象存储服务管理后台,左侧导航栏选择存储桶列表,我们要创建存储桶。

存储桶名称我们自己起一个就行,要注意的地方就是红圈中所示的访问权限,选择公有读写。然后点击确定,创建存储桶。

创建好后,我们进入存储桶,上传我们的音频文件。

然后我们进行第4步,语音服务的主页,点击入门,我们要找到API调试小助手。

在新打开的页面,往下拉找到红圈中所示的录音文件识别API文档。

然后页面下拉,找到红圈中的API 3.0 Explorer,这个就是API在线调试小助手。

进入小助手后,先点击查看秘钥,把SecretId和SecretKey填写进来。

新打开的页面,我们可以看到SecretId和SecretKey,把它们复制过来就行。

然后我们需要设置5个参数,我们着重看第5个,这个url是从哪来的呢,就是第3步,对象存储服务中,我们建立了存储桶,然后上传了音频文件,这个url就是音频文件的位置,我们一起找一下。

我们来到存储桶中,文件上传完毕了,我们点击音频文件后面的详情。

点击详情后,会打开文件的基本信息,红圈中所示的内容,就是url。

然后我们选择在线调试,然后选择发送请求,接着腾讯云会返回一个ID,这个ID就是我们查询识别结果用的,这里补充一点,就是单次识别,音频文件的长度不能超过一个小时,如果超过了,就要截断,分两个识别。

然后我们看最左侧的红圈,我们选择录音文件识别结果查询,然后输入上一步获取的ID,然后发送请求,音频文件越大,识别越慢,如果查询没结果,就要等一会,如果成功后,就会显示识别后的文字,总体上看,识别效果还是不错的,当然这和每个人的发音有关,发音越清晰识别准确度越高。

以上内容由优质教程资源合作伙伴 “鲸鱼办公” 整理编辑,如果对您有帮助欢迎转发分享!

你可能对这些文章感兴趣:

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注