python 錄制系統聲音的示例
python
wave pyaudiowave 可以通過pip直接install,在安裝pyaudio時,通過正常的pip install 直接安裝一直處于報錯階段,后來想到可以通過輪子直接安裝。
在pypi提供的安裝包中有對應的安裝包,注意,不僅僅是python2和python3的區別,python3的小版本也有點差別。可杯具的是,小主電腦里裝的是python3.8,后來想到還有一個網站可以安裝pythonlibs,找到對應的版本后,下載下來。直接在文件所在目錄,或者在安裝中指定文件目錄中執行安裝
pip install /c/Users/root/Downloads/PyAudio-0.2.11-cp38-cp38-win_amd64.whl代碼和運行
def audio_record(out_file, rec_time): CHUNK = 1024 FORMAT = pyaudio.paInt16 # 16bit編碼格式 CHANNELS = 1 # 單聲道 RATE = 16000 # 16000采樣頻率 p = pyaudio.PyAudio() # 創建音頻流 dev_idx = findInternalRecordingDevice(p) stream = p.open(format=FORMAT, # 音頻流wav格式 channels=CHANNELS, # 單聲道 rate=RATE, # 采樣率16000 input=True, input_device_index=dev_idx, # 指定內錄設備的id,可以不寫,使用win的默認錄音設備 frames_per_buffer=CHUNK) print('Start Recording...') frames = [] # 錄制的音頻流 # 錄制音頻數據 for i in range(0, int(RATE / CHUNK * rec_time)): # 控制錄音時間 data = stream.read(CHUNK) frames.append(data) # 錄制完成 stream.stop_stream() stream.close() p.terminate() print('Recording Done...') # 保存音頻文件 wf = wave.open(out_file, ’wb’) wf.setnchannels(CHANNELS) wf.setsampwidth(p.get_sample_size(FORMAT)) wf.setframerate(RATE) wf.writeframes(b’’.join(frames)) wf.close()
在使用默認錄音設備時,發現是話筒錄音,效果并不是太理想,所以就去查查能不能直接錄系統的聲音。
def findInternalRecordingDevice(p): # 要找查的設備名稱中的關鍵字 target = ’立體聲混音’ # 逐一查找聲音設備 for i in range(p.get_device_count()): devInfo = p.get_device_info_by_index(i) print(devInfo) if devInfo[’name’].find(target) >= 0 and devInfo[’hostApi’] == 0: # print(’已找到內錄設備,序號是 ’,i) return i print(’無法找到內錄設備!’) return -1
可以使用p.get_device_info_by_index()去查看系統有關聲音的設備,通過設置為立體聲混音就可以錄制系統聲音。
保存聲音def save(fileName): # 創建pyAudio對象 p = pyaudio.PyAudio() # 打開用于保存數據的文件 wf = wave.open(fileName, ’wb’) # 設置音頻參數 wf.setnchannels(CHANNELS) wf.setsampwidth(p.get_sample_size(FORMAT)) wf.setframerate(RATE) # 寫入數據 wf.writeframes(b’’.join(_frames)) # 關閉文件 wf.close() # 結束pyaudio p.terminate()
保存聲音是通過上述代碼進行保存,此處的_frames是個list,是通過每錄一個chunk(數據流塊),就把這一塊的數據添加進去
然后只需要重新創建PyAudio對象,把這個list轉為字節串保存到文件中就可以了
問題上述一般可以錄到系統聲音,但在執行的時候發現,并不能。
原因是:win的輸入設備中沒有配置立體聲混音
設置步驟:
在win的聲音調節出,右擊打開聲音設置 找到管理聲音設備 在輸入設備處啟用立體聲混音就此,就完成了錄制系統聲音的需求
注意上述操作,可以外放,可以插入3.5mm耳機,但系統靜音和tpye-c耳機插入的時候不能錄到聲音
完整代碼import osimport pyaudioimport threadingimport waveimport timefrom datetime import datetime# 需要系統打開立體聲混音# 錄音類class Recorder(): def __init__(self, chunk=1024, channels=2, rate=44100): self.CHUNK = chunk self.FORMAT = pyaudio.paInt16 self.CHANNELS = channels self.RATE = rate self._running = True self._frames = [] # 獲取內錄設備序號,在windows操作系統上測試通過,hostAPI = 0 表明是MME設備 def findInternalRecordingDevice(self, p): # 要找查的設備名稱中的關鍵字 target = ’立體聲混音’ # 逐一查找聲音設備 for i in range(p.get_device_count()): devInfo = p.get_device_info_by_index(i) # print(devInfo) if devInfo[’name’].find(target) >= 0 and devInfo[’hostApi’] == 0:# print(’已找到內錄設備,序號是 ’,i)return i print(’無法找到內錄設備!’) return -1 # 開始錄音,開啟一個新線程進行錄音操作 def start(self): threading._start_new_thread(self.__record, ()) # 執行錄音的線程函數 def __record(self): self._running = True self._frames = [] p = pyaudio.PyAudio() # 查找內錄設備 dev_idx = self.findInternalRecordingDevice(p) if dev_idx < 0: return # 在打開輸入流時指定輸入設備 stream = p.open(input_device_index=dev_idx, format=self.FORMAT, channels=self.CHANNELS, rate=self.RATE, input=True, frames_per_buffer=self.CHUNK) # 循環讀取輸入流 while (self._running): data = stream.read(self.CHUNK) self._frames.append(data) # 停止讀取輸入流 stream.stop_stream() # 關閉輸入流 stream.close() # 結束pyaudio p.terminate() return # 停止錄音 def stop(self): self._running = False # 保存到文件 def save(self, fileName): # 創建pyAudio對象 p = pyaudio.PyAudio() # 打開用于保存數據的文件 wf = wave.open(fileName, ’wb’) # 設置音頻參數 wf.setnchannels(self.CHANNELS) wf.setsampwidth(p.get_sample_size(self.FORMAT)) wf.setframerate(self.RATE) # 寫入數據 wf.writeframes(b’’.join(self._frames)) # 關閉文件 wf.close() # 結束pyaudio p.terminate()if __name__ == '__main__': # 檢測當前目錄下是否有record子目錄 if not os.path.exists(’record’): os.makedirs(’record’) print('npython 錄音機 ....n') print('提示:按 r 鍵并回車 開始錄音n') i = input(’請輸入操作碼:’) if i == ’r’: rec = Recorder() begin = time.time() print('n開始錄音,按 s 鍵并回車 停止錄音,自動保存到 record 子目錄n') rec.start() running = True while running: i = input('請輸入操作碼:') if i == ’s’:running = Falseprint('錄音已停止')rec.stop()t = time.time() - beginprint(’錄音時間為%ds’ % t)# 以當前時間為關鍵字保存wav文件rec.save('record/rec_' + datetime.now().strftime('%Y-%m-%d_%H-%M-%S') + '.wav')
以上就是python 錄制系統聲音的示例的詳細內容,更多關于python 錄制系統聲音的資料請關注好吧啦網其它相關文章!
相關文章: