pyaudio:基于pyaudio利用Python编程从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存

您所在的位置:网站首页 十秒朗读 pyaudio:基于pyaudio利用Python编程从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存

pyaudio:基于pyaudio利用Python编程从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存

2024-07-10 06:54| 来源: 网络整理| 查看: 265

pyaudio:基于pyaudio利用Python编程从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存

 

 

 

目录

输出结果

代码实现

 

 

 

输出结果

 

 

代码实现 # -*- coding: utf-8 -*- #pyaudio:利用pyaudio从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存 import wave from pyaudio import PyAudio,paInt16 import urllib #urllib2 import pycurl import urllib.request as urllib2 import json framerate=8000 #采样率 NUM_SAMPLES=2000 #采样点 channels=1 #一个声道 sampwidth=2 #两个字节十六位 TIME=2 #条件变量,可以设置定义录音的时间 def save_wave_file(filename, data): #save the date to the wav file wf = wave.open(filename, 'wb') #二进制写入模式 wf.setnchannels(channels) wf.setsampwidth(sampwidth) #两个字节16位 wf.setframerate(framerate) #帧速率 wf.writeframes(b"".join(data)) #把数据加进去,就会存到硬盘上去wf.writeframes(b"".join(data)) wf.close() def my_record(): pa=PyAudio() stream=pa.open(format=paInt16,channels=1,rate=framerate,input=True,frames_per_buffer=NUM_SAMPLES) my_buf=[] count=0 # while count < TIME*8: #循环2*20次 string_audio_data=stream.read(NUM_SAMPLES) #每读完2000个采样加1 my_buf.append(string_audio_data) count+=1 print('当前正在录音(同时录制系统内部和麦克风的声音)……') save_wave_file('03.wav',my_buf) #文件保存 stream.close() def dump_res(buf): #dump_res即dump_result,buf是curl从网上返回来的缓存 print(buf) my_temp=json.loads(buf) my_list=my_temp['result'] print(type(my_list)) print(my_list[0]) #输出第一个 print('dump_res函数调用成功!') def get_token(): #获取token apikey='2KeNr6nK6ZmMKAbdlM5PUaSC' secretkey='QuDTqg1cMehfwvvyKmZyifAnCoGFiZ3g' auth_url='https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id='+apikey+'&client_secret='+secretkey; # res=urllib2.urlopen(auth_url) #获取服务器响应,res=urllib2.urlopen(auth_url) json_data=res.read() #读取到json_data中 print(json_data,type(json_data)) return json.loads(json_data)['access_token'] def use_cloud(token): #token类似一种访问权限等 fp=wave.open(u'16k.wav','rb') #打开wav文件 nf=fp.getnframes() #获得文件的采样点数量 print('sampwidth',fp.getsampwidth()) print('framerate',fp.getframerate()) print('channels',fp.getnchannels()) f_len=nf*2 #获取文件长度,文件长度计算,每个采样点2个字节 audio_data=fp.readframes(nf) # cuid="XXXXXXXXXX" #硬件地址,my phone xiaomi MAC print(token) srv_url='http://vop.baidu.com/server_api'+'?cuid='+cuid+'&token='+token http_header=[ 'Content-Type:audio/pcm;rate=8000', #音频,原先是pcm,可以改为wav 'Content-length:%d:' % f_len ] c=pycurl.Curl() #实例化curl c.setopt(pycurl.URL,str(srv_url)) #(网址) c.setopt(c.HTTPHEADER, http_header) #网址头部 c.setopt(c.POST, 1) #1表示调用post方法而不是get c.setopt(c.CONNECTTIMEOUT,80) #超时中断 c.setopt(c.TIMEOUT,80) #下载超时 c.setopt(c.WRITEFUNCTION,dump_res) #返回数据,dump_res,进行回调 c.setopt(c.POSTFIELDS,audio_data) #数据 c.setopt(c.POSTFIELDSIZE,f_len) #文件大小 c.perform() #提交, pycurl.perform() print('use_cloud函数over!') if __name__ == "__main__": # my_record() print('录音结束!') token = get_token() use_cloud(token) print('over!')

 

相关文章ASR:基于pyaudio利用python进行语音生成、语音识别总结及其案例详细攻略

 



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3