Scientific Audio

Python for Scientific Audio¶

该存储库的目的是创建一个全面的、精选的与音频/音乐应用科学研究相关的 python 软件/工具列表.

包裹总数：66

Read-Write¶

audiolazy :octocat: - 适用于 Python 的富有表现力的数字信号处理 (DSP) 包.
audioread :octocat: - 跨库（GStreamer + Core Audio + MAD + FFmpeg）音频解码.
mutagen :octocat: - 读取和写入各种格式的各种音频元数据.
pyAV :octocat: - PyAV 是 FFmpeg 或 Libav 的 Pythonic 绑定.
(Py)Soundfile :octocat: - 基于 libsndfile、CFFI 和 NumPy 的库.
pySox :octocat: - 袜子包装.
stempeg :octocat: - STEMS 多流音频的读/写.
tinytag :octocat: - 读取 MP3、OGG、FLAC 和 Wave 文件的音乐元数据.

Transformations - General DSP¶

acoustics :octocat: - 对声学家有用的工具.
AudioTK :octocat: - DSP 滤波器工具箱（很多滤波器）.
AudioTSM :octocat: - 实时音频时间刻度修改程序.
Gammatone :octocat: - Gammatone 滤波器组实现.
pyFFTW :octocat: - FFTW(3) 的包装.
NSGT :octocat: - 非平稳 Gabor 变换，常数 q.
matchering :octocat: - 自动参考音频母带制作.
MDCT :octocat: - MDCT变换.
pydub :octocat: - 通过简单易用的高级界面来操作音频.
pytftb :octocat: - MATLAB 时频工具箱的实现.
pyroomacoustics :octocat: - 室内声学模拟（RIR 发生器）
PyRubberband :octocat: - 包装纸 rubberband 进行变调和时间拉伸.
PyWavelets :octocat: - Python 中的离散小波变换.
Resampy :octocat: - 采样率转换.
SFS-Python :octocat: - 声场合成工具箱.
sound_field_analysis :octocat: - 分析、可视化和处理球形麦克风阵列记录的声场数据.
STFT :octocat: - 短时傅里叶变换的独立包.

Feature extraction¶

aubio :octocat: - 特征提取器，用 C、Python 界面编写.
audioFlux :octocat: - 用于音频和音乐分析、特征提取的库.
audiolazy :octocat: - 实时音频处理库，通用.
essentia :octocat: - 音乐相关的低级和高级特征提取器，基于 C++，包括 Python 绑定.
python_speech_features :octocat: - ASR 的常见语音特征.
pyYAAFE :octocat: - YAAFE 特征提取器的 Python 绑定.
speechpy :octocat: - 语音处理和识别库，目前主要是特征提取.
spafe :octocat: - 用于从音频文件中提取特征的 Python 库.

Data augmentation¶

audiomentations :octocat: - 音频数据增强.
muda :octocat: - 音乐数据增强.
pydiogment :octocat: - 音频数据增强.

Speech Processing¶

aeneas :octocat: - 强制对齐，基于MFCC+DTW，35+语言.
deepspeech :octocat: - 预训练的自动语音识别.
gentle :octocat: - 基于 Kaldi 的强制对齐器.
Parselmouth :octocat: - Python 接口 Praat 语音学和语音分析、合成和操作软件.
persephone :octocat: - 自动音素转录工具.
pyannote.audio :octocat: - 用于说话者二值化的神经构建块.
pyAudioAnalysis² :octocat: - 特征提取、分类、二值化.
py-webrtcvad :octocat: - WebRTC 语音活动检测器的接口.
pypesq :octocat: - PESQ 分数计算的包装器.
pystoi :octocat: - 短期目标清晰度测量（STOI）.
PyWorldVocoder :octocat: - Morise 世界声码器的包装.
Montreal Forced Aligner :octocat: - 强制对齐器，基于Kaldi（HMM），英语（其他可以训练）.
SIDEKIT - 说话者和语言识别.
SpeechRecognition :octocat: - 多个 ASR 引擎和 API 的包装，在线和离线.

Environmental Sounds¶

sed_eval :octocat: - 声音事件检测评估工具箱

Perceptial Models - Auditory Models¶

cochlea :octocat: - 内耳模型.
Brian2 :octocat: - 尖峰神经网络模拟器，包括耳蜗模型.
Loudness :octocat: - 感知响度，包括 Zwicker、Moore/Glasberg 模型.
pyloudnorm :octocat: - 音频响度计和归一化，实现 ITU-R BS.1770-4.
Sound Field Synthesis Toolbox :octocat: - 声场合成工具箱.

Source Separation¶

commonfate :octocat: - 共同的命运模型和转变.
NTFLib :octocat: - 稀疏 Beta 散度张量分解.
NUSSL :octocat: - 整体源分离框架，包括DSP方法和深度学习方法.
NIMFA :octocat: - 非负矩阵分解的几种风格.

Music Information Retrieval¶

Catchy :octocat: - 用于计算挂钩发现的语料库分析工具.
chord-detection :octocat: - 和弦检测和调估计的算法.
Madmom :octocat: - MIR 软件包重点关注节拍检测、起始检测和和弦识别.
mir_eval :octocat: - 各种 MIR 任务的通用分数. 还包括 bss_eval 实现.
msaf :octocat: - 音乐结构分析框架.
librosa :octocat: - 一般音频和音乐分析.

Deep Learning¶

Kapre :octocat: - Keras 音频预处理器
TorchAudio :octocat: - PyTorch 音频加载器
nnAudio :octocat: - 在 PyTorch 中使用一维卷积网络加速音频处理.

Symbolic Music - MIDI - Musicology¶

Music21 :octocat: - 计算机辅助音乐学工具包.
Mido :octocat: - 实时 MIDI 包装器.
mingus :octocat: - 高级音乐理论和记谱包，支持 MIDI 文件和播放.
Pretty-MIDI :octocat: - 以良好/直观的方式处理 MIDI 数据的实用函数.

Realtime applications¶

Jupylet :octocat: - 减法、加法、FM 和基于样本的声音合成.
PYO :octocat: - 实时音频 DSP 引擎.
python-sounddevice :octocat: - PortAudio 包装器通过 NumPy 提供实时音频 I/O.
ReTiSAR :octocat: - 流式传输或基于 IR 的高阶球形麦克风阵列信号的二进制渲染.

Web Audio¶

TimeSide (Beta) :octocat: - 高级音频分析、成像、转码、流媒体和标签.

Audio Dataset and Dataloaders¶

beets :octocat: - 音乐库管理器和 MusicBrainz 标签.
musdb :octocat: - 解析和处理MUSDB18数据集.
medleydb :octocat: - 解析 medleydb 音频+注释.
Soundcloud API :octocat: - 包装纸 Soundcloud API.
Youtube-Downloader :octocat: - Download youtube videos (and the audio).
audiomate :octocat: - 加载不同类型的音频数据集.
mirdata :octocat: - 音乐信息检索 (MIR) 数据集的通用加载器.

Wrappers for Audio Plugins¶

VamPy Host - 接口编译的鞋面插件.

Tutorials¶

Whirlwind Tour Of Python :octocat: - 针对研究人员和开发人员的 Python 基础知识快速介绍.
Introduction to Numpy and Scipy :octocat: - 强烈推荐的教程，涵盖科学 Python 生态系统的大部分内容.
Numpy for MATLAB® Users - 切换器的等效 Python 函数的简短概述.
MIR Notebooks :octocat: - 用于音乐信息检索 (MIR) 的教学 iPython Notebooks 集合.
Selected Topics in Audio Signal Processing - 作为 iPython 笔记本进行练习.
Live-coding a music synthesizer 实时编码视频展示如何使用 SoundDevice 库再现真实的声音. Code.

Books¶

Python Data Science Handbook - Jake Vanderplas，优秀书籍和随附的教程笔记本.
Fundamentals of Music Processing - Meinard Müller，附带 Python 练习.

Scientific Papers¶

Python for audio signal processing - John C. Glover、Victor Lazzarini 和 Joseph Timoney，2011 年 Linux 音频会议.
librosa: Audio and Music Signal Analysis in Python, Video - Brian McFee、Colin Raffel、Daven Liang、Daniel PW Ellis、Matt McVicar、Eric Battenberg、Oriol Nieto、Scipy
pyannote.audio: neural building blocks for speaker diarization, Video - Hervé Bredin、Ruiqing Yin、Juan Manuel Coria、Gregory Gelly、Pavel Korshunov、Marvin Lavechin、Diego Fustes、Hadrien Titeux、Wassim Bouaziz、Marie-Philippe Gill，ICASSP 2020.

Other Resources¶

Coursera Course - 音频信号处理，巴塞罗那 UPF 和斯坦福大学基于 Python 的课程.
Digital Signal Processing Course - 硕士课程材料（罗斯托克大学），包含许多 Python 示例.
Slack Channel - 音乐信息检索社区.

已经有 PythonInMusic 但它不是最新的，并且包含太多与科学应用无关的特殊兴趣包. Awesome-Python 是 python 软件包的大型精选列表. 然而，音频部分非常小.

Contributing¶

随时欢迎您的贡献！请看一下 contribution guidelines 第一的.

如果我不确定这些库是否很棒，我将保留一些拉取请求，您可以通过添加它们来投票给它们.