본 게시글은 Dacon에서 JunhoSun님이 공유해주신 음성 신호 기본 정보를 바탕으로 작성되었습니다. 모든 코드와 음성 파일은 Github에서 확인하실 수 있습니다. 목차 Intro Import Data Load Spectrogram, Melspectrogram 변환 주요 개념 푸리에 변환 STFT Melspectrogram Function and Option win_length n_fft hop_length n_mels Spectrogram, Melspectrogram 구하기 해상력 Intro 음성 신호에 대한 기본적인 내용을 설명하고 torchaudio를 사용하여 spectrogram과 melspectrogram feature를 만드는 과정에 대해 알아보겠습니다. Import Data Load 음..
모든 실습 코드는 Ref [1]을 확인해주세요 목차 Import Display Waveform FFT -> Power Spectrum SFTF -> Spectrogram Cast Amplitude to Decibels MFCCs Import import numpy as np import librosa, librosa.display import matplotlib.pyplot as plt Display Waveform FIG_SIZE = (15, 10) file = "blues.00000.wav" # load audio file with Librosa signal, sample_rate = librosa.load(file, sr=22050) print('signal shape : ', signal.shap..
- Total
- Today
- Yesterday
- netron
- nlg
- 시계열
- Introduction to Algorithm
- 오디오 전처리
- keras
- tensorflow
- boto3
- stft
- S3
- RNN
- lambda
- AWS
- LSTM
- 모델 시각화
- 알고리즘
- BOJ
- 핵심어 검출
- 6.006
- nlp
- 인공지능 스피커 호출
- Tensorflow2.0
- nlp 트렌드
- 알고리즘 강의
- MFCC
- MIT
- TF2.0
- wavenet
- librosa
- aws cli
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |