web Audio实现pcm音频数据收集

2019年04月09日Web前端0

前面利用web audio api播放了本地音乐，并且利用createOscillator生成音频并播放。既然如此，我们能否接着用js去实现简单的录音呢？

音频源

getUserMedia

录音的音频源当然是设备的话筒（音频输入设备），所以需要用到navigator.mediaDevices.getUserMedia()这个方法。

该方法有一个参数，

constraints，指定请求的媒体类型，这儿只牵扯都音频，所以仅需audio:true即可。

该方法返回一个promise，成功回调的参数是一个 MediaStream对象。

注：不推荐使用navigator.getUserMedia()方法，因为该方法已经从web标准中删除了。

createMediaStreamSource

此时createMediaStreamSource()方法就有用啦，引用MDN上的一段话：AudioContext接口的createMediaStreamSource()方法用于创建一个新的MediaStreamAudioSourceNode 对象，需要传入一个媒体流对象(MediaStream对象)，然后来自MediaStream的音频就可以被播放和操作。

他返回的是MediaStreamAudioSourceNode类型的，也就是音频源节点，到此处，音频源已经有了，下面看下保存音频的节点（音频处理节点）。

navigator.mediaDevices.getUserMedia({
    audio: true
}).then((stream) => {
    audioInput = context.createMediaStreamSource(stream);
}).catch((err) => {
    console.log('error');
});

此时，audioInput就是音频源节点。

音频处理节点

createScriptProcessor

createScriptProcessor()，该方法创建一个ScriptProcessorNode用于通过JavaScript直接处理音频，有三个参数：

bufferSize，缓冲区大小，以样本帧为单位。一般有以下值 256, 512, 1024, 2048, 4096, 8192, 16384。当传0时，系统会取当前环境最合适的缓冲区大小。每当缓冲区满时，则会触发audioprocess事件，即bufferSize控制着回调事件的频率。注：mdn提示 chrome 31版本的不支持传0的方式。
numberOfInputChannels，值为整数，用于指定输入node的声道的数量，默认值是2，最高能为32，且不能为0。
numberOfOutputChannels，值为整数，用于指定输出node的声道的数量，默认值是2，最高能取32，不能为0。

保证numberOfInputChannels和numberOfOutputChannels相等就行了，通过监听audioprocess后，就可以处理对应的音频流了。

recorder = context.createScriptProcessor(4096, 1, 1);
recorder.onaudioprocess = function(e) {
    // getChannelData返回Float32Array类型的pcm数据
    var data = e.inputBuffer.getChannelData(0);
    
    inputData.push(newFloat32Array(data));
    size += data.length;
}

我这默认是一通道的，所以只对0进行了数据收集。MDN上说，audioporcess缓冲区的数据是，非交错的32位线性PCM，标称范围介于-1和之间+1，即32位浮点缓冲区，每个样本介于-1.0和1.0之间。所以等录音结束后，inputData中就是存放的pcm格式的录音数据了（还需处理下）。

总结

现在我们手上已经有了简单的pcm数据了，为了能够正常的播放，还得略微处理下，下篇将将探讨如何转数字信号。

代码地址：web Audio实现pcm音频数据收集，想要看js录音的可以看这篇文章：纯js实现录音与播放。