[提取特定人音频的方法]FFmpeg从视频中提取音频

参照网志

ffmpeg DocumentationFFmpeg遍布世界各地讲义FFmpeg 抽取音频的音音频FFMPEG 抽取音音频ffmpeg 给音音频加进宣传照,ffmpeg对音音频metadata有关操作方式

采用

ffprobe 是两个影音流预测辅助工具。它从影音过程中将搜集重要信息,因此以人类文明和电脑复本的方式列印出。它能用以检验影音流的罐子类别,和每两个影音流的文件格式和类别。它能做为两个分立的应用领域以采用,也能紧密结合文档冷却系统继续执行更繁杂的处置。—— FFmpeg遍布世界各地讲义

bit/取样振幅

bit是指每秒钟历史记录的音音频正确率。 模拟信号取样为位数信号,两个音音频样品而已两个位数,代表者在两个某一天数点的量测电磁波值。音音频bit和音频帧率是相近的,但在每两个中确保易用性的一般来说的最高位四元组十分相同的。对音频而言,为的是确保体育运动的精确叙述,每秒最少须要24帧。对音音频而言,要明晰地则表示英文音频,每秒的最轻取样四元组8000安培。

8,000 Hz是电话号码所制bit, 对人的骂人早已足够多

11,025 Hz是AM中波该台所制bit

22,050 Hz和24,000 Hz 是FM中波该台所制bit

32,000 Hz是miniDV 多媒体音频 camcorder、DAT (LP mode)所制bit

44,100 Hz是音音频 CD, 也常用于 MPEG-1 音音频(VCD, SVCD, MP3)所制bit (超过该bit,人耳很难分辨)

47,250 Hz是商用 PCM 录音机所制bit

48,000 Hz是miniDV、位数电视、DVD、DAT、电影和专业音音频所制的位数声音所制bit

50,000 Hz是商用位数录音机所制bit

96,000 或者 192,000 Hz 是DVD-Audio、一些 LPCM DVD 音轨、BD-ROM(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨所制所制bit

2.8224 MHz是Direct Stream Digital 的 1 位 sigma-delta modulation 过程所制bit

取样深度/取样精度/取样大小

用多大bit(多少位0/1)来则表示每个取样点处的振幅。越大把振幅分得越精细,录音听起来越接近原声。电话号码音音频最常见的取样深度是16比特和32比特。—— 《通信原理》信源编码

比特率

比特率指每秒传输重要信息的比特数。1B=8b, B=byte(字节), b=bit(位)音音频的比特率公式: 比特率 = bit * 单个的周期音音频数据长度 。

如16bit 双声道 48KHz音音频的比特率

48KHz * (16 * 2) = 1536kbps = 192 kBps

FFmpeg采用方式 —— FFmpeg遍布世界各地讲义

—— ? FFmpeg 抽取音频的音音频

主要选项

音音频选项

高级选项

软件 mp3tag

能加进、更改歌曲重要信息

采用创建ID3 tags 【参照网志】

清除音音频文件所有tag重要信息

把value置空删除某个标签 创建元数据文档文件 把.txt写入元数据中

代表者采用输入顺序为1的文件做为metadata,也就是 metadata.txt。 代表者codec audio的意思,这里用的是 copy。 和 是为的是对Windows兼容加上的。

—— 参照官网

拓展

提高音量 但是不能损失质量怎么给音音频文件加进歌词重要信息,并天数上同步起来实现音乐播放软件中的所有完整的歌曲重要信息

python + ffmpeg

发布于 2022-09-27 17:09:11
收藏
分享
海报
98
上一篇:[控糖几点加餐合适]糖尿病人还能加餐?出现这个情况,睡前一定要加餐,否则很危险! 下一篇:[提取特定人音频的方法]一种基于多尺度通道分离卷积特征提取的说话人聚类方法
目录