Scientific Audio
Python for Scientific Audio¶
该存储库的目的是创建一个全面的、精选的与音频/音乐应用科学研究相关的 python 软件/工具列表.
Audio Related Packages¶
- 包裹总数:66
Read-Write¶
- audiolazy :octocat: - 适用于 Python 的富有表现力的数字信号处理 (DSP) 包.
- audioread :octocat: - 跨库(GStreamer + Core Audio + MAD + FFmpeg)音频解码.
- mutagen :octocat: - 读取和写入各种格式的各种音频元数据.
- pyAV :octocat: - PyAV 是 FFmpeg 或 Libav 的 Pythonic 绑定.
- (Py)Soundfile :octocat: - 基于 libsndfile、CFFI 和 NumPy 的库.
- pySox :octocat: - 袜子包装.
- stempeg :octocat: - STEMS 多流音频的读/写.
- tinytag :octocat: - 读取 MP3、OGG、FLAC 和 Wave 文件的音乐元数据.
Transformations - General DSP¶
- acoustics :octocat: - 对声学家有用的工具.
- AudioTK :octocat: - DSP 滤波器工具箱(很多滤波器).
- AudioTSM :octocat: - 实时音频时间刻度修改程序.
- Gammatone :octocat: - Gammatone 滤波器组实现.
- pyFFTW :octocat: - FFTW(3) 的包装.
- NSGT :octocat: - 非平稳 Gabor 变换,常数 q.
- matchering :octocat: - 自动参考音频母带制作.
- MDCT :octocat: - MDCT变换.
- pydub :octocat: - 通过简单易用的高级界面来操作音频.
- pytftb :octocat: - MATLAB 时频工具箱的实现.
- pyroomacoustics :octocat: - 室内声学模拟(RIR 发生器)
- PyRubberband :octocat: - 包装纸 rubberband 进行变调和时间拉伸.
- PyWavelets :octocat: - Python 中的离散小波变换.
- Resampy :octocat: - 采样率转换.
- SFS-Python :octocat: - 声场合成工具箱.
- sound_field_analysis :octocat: - 分析、可视化和处理球形麦克风阵列记录的声场数据.
- STFT :octocat: - 短时傅里叶变换的独立包.
Feature extraction¶
- aubio :octocat: - 特征提取器,用 C、Python 界面编写.
- audioFlux :octocat: - 用于音频和音乐分析、特征提取的库.
- audiolazy :octocat: - 实时音频处理库,通用.
- essentia :octocat: - 音乐相关的低级和高级特征提取器,基于 C++,包括 Python 绑定.
- python_speech_features :octocat: - ASR 的常见语音特征.
- pyYAAFE :octocat: - YAAFE 特征提取器的 Python 绑定.
- speechpy :octocat: - 语音处理和识别库,目前主要是特征提取.
- spafe :octocat: - 用于从音频文件中提取特征的 Python 库.
Data augmentation¶
- audiomentations :octocat: - 音频数据增强.
- muda :octocat: - 音乐数据增强.
- pydiogment :octocat: - 音频数据增强.
Speech Processing¶
- aeneas :octocat: - 强制对齐,基于MFCC+DTW,35+语言.
- deepspeech :octocat: - 预训练的自动语音识别.
- gentle :octocat: - 基于 Kaldi 的强制对齐器.
- Parselmouth :octocat: - Python 接口 Praat 语音学和语音分析、合成和操作软件.
- persephone :octocat: - 自动音素转录工具.
- pyannote.audio :octocat: - 用于说话者二值化的神经构建块.
- pyAudioAnalysis² :octocat: - 特征提取、分类、二值化.
- py-webrtcvad :octocat: - WebRTC 语音活动检测器的接口.
- pypesq :octocat: - PESQ 分数计算的包装器.
- pystoi :octocat: - 短期目标清晰度测量(STOI).
- PyWorldVocoder :octocat: - Morise 世界声码器的包装.
- Montreal Forced Aligner :octocat: - 强制对齐器,基于Kaldi(HMM),英语(其他可以训练).
- SIDEKIT - 说话者和语言识别.
- SpeechRecognition :octocat: - 多个 ASR 引擎和 API 的包装,在线和离线.
Environmental Sounds¶
Perceptial Models - Auditory Models¶
- cochlea :octocat: - 内耳模型.
- Brian2 :octocat: - 尖峰神经网络模拟器,包括耳蜗模型.
- Loudness :octocat: - 感知响度,包括 Zwicker、Moore/Glasberg 模型.
- pyloudnorm :octocat: - 音频响度计和归一化,实现 ITU-R BS.1770-4.
- Sound Field Synthesis Toolbox :octocat: - 声场合成工具箱.
Source Separation¶
- commonfate :octocat: - 共同的命运模型和转变.
- NTFLib :octocat: - 稀疏 Beta 散度张量分解.
- NUSSL :octocat: - 整体源分离框架,包括DSP方法和深度学习方法.
- NIMFA :octocat: - 非负矩阵分解的几种风格.
Music Information Retrieval¶
- Catchy :octocat: - 用于计算挂钩发现的语料库分析工具.
- chord-detection :octocat: - 和弦检测和调估计的算法.
- Madmom :octocat: - MIR 软件包重点关注节拍检测、起始检测和和弦识别.
- mir_eval :octocat: - 各种 MIR 任务的通用分数. 还包括 bss_eval 实现.
- msaf :octocat: - 音乐结构分析框架.
- librosa :octocat: - 一般音频和音乐分析.
Deep Learning¶
- Kapre :octocat: - Keras 音频预处理器
- TorchAudio :octocat: - PyTorch 音频加载器
- nnAudio :octocat: - 在 PyTorch 中使用一维卷积网络加速音频处理.
Symbolic Music - MIDI - Musicology¶
- Music21 :octocat: - 计算机辅助音乐学工具包.
- Mido :octocat: - 实时 MIDI 包装器.
- mingus :octocat: - 高级音乐理论和记谱包,支持 MIDI 文件和播放.
- Pretty-MIDI :octocat: - 以良好/直观的方式处理 MIDI 数据的实用函数.
Realtime applications¶
- Jupylet :octocat: - 减法、加法、FM 和基于样本的声音合成.
- PYO :octocat: - 实时音频 DSP 引擎.
- python-sounddevice :octocat: - PortAudio 包装器通过 NumPy 提供实时音频 I/O.
- ReTiSAR :octocat: - 流式传输或基于 IR 的高阶球形麦克风阵列信号的二进制渲染.
Web Audio¶
- TimeSide (Beta) :octocat: - 高级音频分析、成像、转码、流媒体和标签.
Audio Dataset and Dataloaders¶
- beets :octocat: - 音乐库管理器和 MusicBrainz 标签.
- musdb :octocat: - 解析和处理MUSDB18数据集.
- medleydb :octocat: - 解析 medleydb 音频+注释.
- Soundcloud API :octocat: - 包装纸 Soundcloud API.
- Youtube-Downloader :octocat: - Download youtube videos (and the audio).
- audiomate :octocat: - 加载不同类型的音频数据集.
- mirdata :octocat: - 音乐信息检索 (MIR) 数据集的通用加载器.
Wrappers for Audio Plugins¶
- VamPy Host - 接口编译的鞋面插件.
Tutorials¶
- Whirlwind Tour Of Python :octocat: - 针对研究人员和开发人员的 Python 基础知识快速介绍.
- Introduction to Numpy and Scipy :octocat: - 强烈推荐的教程,涵盖科学 Python 生态系统的大部分内容.
- Numpy for MATLAB® Users - 切换器的等效 Python 函数的简短概述.
- MIR Notebooks :octocat: - 用于音乐信息检索 (MIR) 的教学 iPython Notebooks 集合.
- Selected Topics in Audio Signal Processing - 作为 iPython 笔记本进行练习.
- Live-coding a music synthesizer 实时编码视频展示如何使用 SoundDevice 库再现真实的声音. Code.
Books¶
- Python Data Science Handbook - Jake Vanderplas,优秀书籍和随附的教程笔记本.
- Fundamentals of Music Processing - Meinard Müller,附带 Python 练习.
Scientific Papers¶
- Python for audio signal processing - John C. Glover、Victor Lazzarini 和 Joseph Timoney,2011 年 Linux 音频会议.
- librosa: Audio and Music Signal Analysis in Python, Video - Brian McFee、Colin Raffel、Daven Liang、Daniel PW Ellis、Matt McVicar、Eric Battenberg、Oriol Nieto、Scipy
- pyannote.audio: neural building blocks for speaker diarization, Video - Hervé Bredin、Ruiqing Yin、Juan Manuel Coria、Gregory Gelly、Pavel Korshunov、Marvin Lavechin、Diego Fustes、Hadrien Titeux、Wassim Bouaziz、Marie-Philippe Gill,ICASSP 2020.
Other Resources¶
- Coursera Course - 音频信号处理,巴塞罗那 UPF 和斯坦福大学基于 Python 的课程.
- Digital Signal Processing Course - 硕士课程材料(罗斯托克大学),包含许多 Python 示例.
- Slack Channel - 音乐信息检索社区.
Related lists¶
已经有 PythonInMusic 但它不是最新的,并且包含太多与科学应用无关的特殊兴趣包. Awesome-Python 是 python 软件包的大型精选列表. 然而,音频部分非常小.
Contributing¶
随时欢迎您的贡献! 请看一下 contribution guidelines 第一的.
如果我不确定这些库是否很棒,我将保留一些拉取请求,您可以通过添加它们来投票给它们.