torchaudio Documentation

Main Page

Attributes

torchaudio.functional.TokenSpan.end
torchaudio.functional.TokenSpan.score
torchaudio.functional.TokenSpan.start
torchaudio.functional.TokenSpan.token
torchaudio.io.StreamReader
torchaudio.io.StreamWriter
torchaudio.models.decoder.CTCHypothesis.score
torchaudio.models.decoder.CTCHypothesis.timesteps
torchaudio.models.decoder.CTCHypothesis.tokens
torchaudio.models.decoder.CTCHypothesis.words
torchaudio.models.decoder.CUCTCHypothesis.score
torchaudio.models.decoder.CUCTCHypothesis.tokens
torchaudio.models.decoder.CUCTCHypothesis.words
torio.io.CodecConfig.bit_rate
torio.io.CodecConfig.compression_level
torio.io.CodecConfig.gop_size
torio.io.CodecConfig.max_b_frames
torio.io.CodecConfig.qscale
torio.io._streaming_media_decoder.ChunkTensor.pts
torio.io._streaming_media_decoder.OutputAudioStream.num_channels
torio.io._streaming_media_decoder.OutputAudioStream.sample_rate
torio.io._streaming_media_decoder.OutputStream.filter_description
torio.io._streaming_media_decoder.OutputStream.format
torio.io._streaming_media_decoder.OutputStream.media_type
torio.io._streaming_media_decoder.OutputStream.source_index
torio.io._streaming_media_decoder.OutputVideoStream.frame_rate
torio.io._streaming_media_decoder.OutputVideoStream.height
torio.io._streaming_media_decoder.OutputVideoStream.width
torio.io._streaming_media_decoder.SourceAudioStream.num_channels
torio.io._streaming_media_decoder.SourceAudioStream.sample_rate
torio.io._streaming_media_decoder.SourceStream.bit_rate
torio.io._streaming_media_decoder.SourceStream.bits_per_sample
torio.io._streaming_media_decoder.SourceStream.codec
torio.io._streaming_media_decoder.SourceStream.codec_long_name
torio.io._streaming_media_decoder.SourceStream.format
torio.io._streaming_media_decoder.SourceStream.media_type
torio.io._streaming_media_decoder.SourceStream.metadata
torio.io._streaming_media_decoder.SourceStream.num_frames
torio.io._streaming_media_decoder.SourceVideoStream.frame_rate
torio.io._streaming_media_decoder.SourceVideoStream.height
torio.io._streaming_media_decoder.SourceVideoStream.width
torio::io::Chunk::frames
torio::io::Chunk::pts
torio::io::OutputStreamInfo::filter_description
torio::io::OutputStreamInfo::format
torio::io::OutputStreamInfo::frame_rate
torio::io::OutputStreamInfo::height
torio::io::OutputStreamInfo::media_type
torio::io::OutputStreamInfo::num_channels
torio::io::OutputStreamInfo::sample_rate
torio::io::OutputStreamInfo::source_index
torio::io::OutputStreamInfo::width
torio::io::SrcStreamInfo::bit_rate
torio::io::SrcStreamInfo::bits_per_sample
torio::io::SrcStreamInfo::codec_long_name
torio::io::SrcStreamInfo::codec_name
torio::io::SrcStreamInfo::fmt_name
torio::io::SrcStreamInfo::frame_rate
torio::io::SrcStreamInfo::height
torio::io::SrcStreamInfo::media_type
torio::io::SrcStreamInfo::metadata
torio::io::SrcStreamInfo::num_channels
torio::io::SrcStreamInfo::num_frames
torio::io::SrcStreamInfo::sample_rate
torio::io::SrcStreamInfo::width

Classs

torchaudio.AudioMetaData
torchaudio.datasets.CMUARCTIC
torchaudio.datasets.CMUDict
torchaudio.datasets.COMMONVOICE
torchaudio.datasets.DR_VCTK
torchaudio.datasets.FluentSpeechCommands
torchaudio.datasets.GTZAN
torchaudio.datasets.IEMOCAP
torchaudio.datasets.LIBRISPEECH
torchaudio.datasets.LIBRITTS
torchaudio.datasets.LJSPEECH
torchaudio.datasets.LibriLightLimited
torchaudio.datasets.LibriMix
torchaudio.datasets.MUSDB_HQ
torchaudio.datasets.QUESST14
torchaudio.datasets.SPEECHCOMMANDS
torchaudio.datasets.Snips
torchaudio.datasets.TEDLIUM
torchaudio.datasets.VCTK_092
torchaudio.datasets.VoxCeleb1Identification
torchaudio.datasets.VoxCeleb1Verification
torchaudio.datasets.YESNO
torchaudio.functional.TokenSpan
torchaudio.io.AudioEffector
torchaudio.io._playback.play_audio
torchaudio.models.Conformer
torchaudio.models.ConvTasNet
torchaudio.models.DeepSpeech
torchaudio.models.Emformer
torchaudio.models.HDemucs
torchaudio.models.HuBERTPretrainModel
torchaudio.models.RNNT
torchaudio.models.RNNTBeamSearch
torchaudio.models.SquimObjective
torchaudio.models.SquimSubjective
torchaudio.models.Tacotron2
torchaudio.models.Wav2Letter
torchaudio.models.Wav2Vec2Model
torchaudio.models.WaveRNN
torchaudio.models.decoder.CTCDecoder
torchaudio.models.decoder.CTCDecoderLM
torchaudio.models.decoder.CTCDecoderLMState
torchaudio.models.decoder.CTCHypothesis
torchaudio.models.decoder.CUCTCDecoder
torchaudio.models.decoder.CUCTCHypothesis
torchaudio.pipelines.RNNTBundle
torchaudio.pipelines.RNNTBundle.FeatureExtractor
torchaudio.pipelines.RNNTBundle.TokenProcessor
torchaudio.pipelines.SourceSeparationBundle
torchaudio.pipelines.SquimObjectiveBundle
torchaudio.pipelines.SquimSubjectiveBundle
torchaudio.pipelines.Tacotron2TTSBundle
torchaudio.pipelines.Tacotron2TTSBundle.TextProcessor
torchaudio.pipelines.Tacotron2TTSBundle.Vocoder
torchaudio.pipelines.Wav2Vec2ASRBundle
torchaudio.pipelines.Wav2Vec2Bundle
torchaudio.pipelines.Wav2Vec2FABundle
torchaudio.pipelines.Wav2Vec2FABundle.Aligner
torchaudio.pipelines.Wav2Vec2FABundle.Tokenizer
torchaudio.prototype.datasets.Musan
torchaudio.prototype.models.ConformerWav2Vec2PretrainModel
torchaudio.prototype.models.ConvEmformer
torchaudio.prototype.models.HiFiGANVocoder
torchaudio.prototype.pipelines.HiFiGANVocoderBundle
torchaudio.prototype.pipelines.VGGishBundle
torchaudio.prototype.pipelines.VGGishBundle.VGGish
torchaudio.prototype.pipelines.VGGishBundle.VGGishInputProcessor
torchaudio.prototype.transforms.BarkScale
torchaudio.prototype.transforms.BarkSpectrogram
torchaudio.prototype.transforms.ChromaScale
torchaudio.prototype.transforms.ChromaSpectrogram
torchaudio.prototype.transforms.InverseBarkScale
torchaudio.transforms.AddNoise
torchaudio.transforms.AmplitudeToDB
torchaudio.transforms.ComputeDeltas
torchaudio.transforms.Convolve
torchaudio.transforms.Deemphasis
torchaudio.transforms.FFTConvolve
torchaudio.transforms.Fade
torchaudio.transforms.FrequencyMasking
torchaudio.transforms.GriffinLim
torchaudio.transforms.InverseMelScale
torchaudio.transforms.InverseSpectrogram
torchaudio.transforms.LFCC
torchaudio.transforms.Loudness
torchaudio.transforms.MFCC
torchaudio.transforms.MVDR
torchaudio.transforms.MelScale
torchaudio.transforms.MelSpectrogram
torchaudio.transforms.MuLawDecoding
torchaudio.transforms.MuLawEncoding
torchaudio.transforms.PSD
torchaudio.transforms.PitchShift
torchaudio.transforms.Preemphasis
torchaudio.transforms.RNNTLoss
torchaudio.transforms.RTFMVDR
torchaudio.transforms.Resample
torchaudio.transforms.SlidingWindowCmn
torchaudio.transforms.SoudenMVDR
torchaudio.transforms.SpectralCentroid
torchaudio.transforms.Spectrogram
torchaudio.transforms.Speed
torchaudio.transforms.SpeedPerturbation
torchaudio.transforms.TimeMasking
torchaudio.transforms.TimeStretch
torchaudio.transforms.Vad
torchaudio.transforms.Vol
torio.io.CodecConfig
torio.io.StreamingMediaDecoder
torio.io.StreamingMediaEncoder
torio.io._streaming_media_decoder.ChunkTensor
torio.io._streaming_media_decoder.OutputAudioStream
torio.io._streaming_media_decoder.OutputStream
torio.io._streaming_media_decoder.OutputVideoStream
torio.io._streaming_media_decoder.SourceAudioStream
torio.io._streaming_media_decoder.SourceStream
torio.io._streaming_media_decoder.SourceVideoStream
torio::io::Chunk
torio::io::OutputStreamInfo
torio::io::SrcStreamInfo
torio::io::StreamingMediaDecoder
torio::io::StreamingMediaDecoderCustomIO
torio::io::StreamingMediaEncoder
torio::io::StreamingMediaEncoderCustomIO

Functions

torchaudio.compliance.kaldi.fbank
torchaudio.compliance.kaldi.mfcc
torchaudio.compliance.kaldi.spectrogram
torchaudio.functional.DB_to_amplitude
torchaudio.functional.add_noise
torchaudio.functional.allpass_biquad
torchaudio.functional.amplitude_to_DB
torchaudio.functional.apply_beamforming
torchaudio.functional.apply_codec
torchaudio.functional.band_biquad
torchaudio.functional.bandpass_biquad
torchaudio.functional.bandreject_biquad
torchaudio.functional.bass_biquad
torchaudio.functional.biquad
torchaudio.functional.compute_deltas
torchaudio.functional.contrast
torchaudio.functional.convolve
torchaudio.functional.create_dct
torchaudio.functional.dcshift
torchaudio.functional.deemph_biquad
torchaudio.functional.deemphasis
torchaudio.functional.detect_pitch_frequency
torchaudio.functional.dither
torchaudio.functional.edit_distance
torchaudio.functional.equalizer_biquad
torchaudio.functional.fftconvolve
torchaudio.functional.filtfilt
torchaudio.functional.flanger
torchaudio.functional.forced_align
torchaudio.functional.frechet_distance
torchaudio.functional.gain
torchaudio.functional.griffinlim
torchaudio.functional.highpass_biquad
torchaudio.functional.inverse_spectrogram
torchaudio.functional.lfilter
torchaudio.functional.linear_fbanks
torchaudio.functional.loudness
torchaudio.functional.lowpass_biquad
torchaudio.functional.mask_along_axis
torchaudio.functional.mask_along_axis_iid
torchaudio.functional.melscale_fbanks
torchaudio.functional.merge_tokens
torchaudio.functional.mu_law_decoding
torchaudio.functional.mu_law_encoding
torchaudio.functional.mvdr_weights_rtf
torchaudio.functional.mvdr_weights_souden
torchaudio.functional.overdrive
torchaudio.functional.phase_vocoder
torchaudio.functional.phaser
torchaudio.functional.pitch_shift
torchaudio.functional.preemphasis
torchaudio.functional.psd
torchaudio.functional.resample
torchaudio.functional.riaa_biquad
torchaudio.functional.rnnt_loss
torchaudio.functional.rtf_evd
torchaudio.functional.rtf_power
torchaudio.functional.sliding_window_cmn
torchaudio.functional.spectral_centroid
torchaudio.functional.spectrogram
torchaudio.functional.speed
torchaudio.functional.treble_biquad
torchaudio.functional.vad
torchaudio.info
torchaudio.kaldi_io.read_mat_ark
torchaudio.kaldi_io.read_mat_scp
torchaudio.kaldi_io.read_vec_flt_ark
torchaudio.kaldi_io.read_vec_flt_scp
torchaudio.kaldi_io.read_vec_int_ark
torchaudio.list_audio_backends
torchaudio.load
torchaudio.models.conv_tasnet_base
torchaudio.models.decoder.ctc_decoder
torchaudio.models.decoder.cuda_ctc_decoder
torchaudio.models.decoder.download_pretrained_files
torchaudio.models.emformer_rnnt_base
torchaudio.models.emformer_rnnt_model
torchaudio.models.hdemucs_high
torchaudio.models.hdemucs_low
torchaudio.models.hdemucs_medium
torchaudio.models.hubert_base
torchaudio.models.hubert_large
torchaudio.models.hubert_pretrain_base
torchaudio.models.hubert_pretrain_large
torchaudio.models.hubert_pretrain_model
torchaudio.models.hubert_pretrain_xlarge
torchaudio.models.hubert_xlarge
torchaudio.models.squim_objective_base
torchaudio.models.squim_objective_model
torchaudio.models.squim_subjective_base
torchaudio.models.squim_subjective_model
torchaudio.models.wav2vec2.utils.import_fairseq_model
torchaudio.models.wav2vec2.utils.import_huggingface_model
torchaudio.models.wav2vec2_base
torchaudio.models.wav2vec2_large
torchaudio.models.wav2vec2_large_lv60k
torchaudio.models.wav2vec2_model
torchaudio.models.wav2vec2_xlsr_1b
torchaudio.models.wav2vec2_xlsr_2b
torchaudio.models.wav2vec2_xlsr_300m
torchaudio.models.wavlm_base
torchaudio.models.wavlm_large
torchaudio.models.wavlm_model
torchaudio.prototype.functional.adsr_envelope
torchaudio.prototype.functional.barkscale_fbanks
torchaudio.prototype.functional.chroma_filterbank
torchaudio.prototype.functional.extend_pitch
torchaudio.prototype.functional.filter_waveform
torchaudio.prototype.functional.frequency_impulse_response
torchaudio.prototype.functional.oscillator_bank
torchaudio.prototype.functional.ray_tracing
torchaudio.prototype.functional.simulate_rir_ism
torchaudio.prototype.functional.sinc_impulse_response
torchaudio.prototype.models.conformer_rnnt_base
torchaudio.prototype.models.conformer_rnnt_model
torchaudio.prototype.models.conformer_wav2vec2_base
torchaudio.prototype.models.conformer_wav2vec2_model
torchaudio.prototype.models.conformer_wav2vec2_pretrain_base
torchaudio.prototype.models.conformer_wav2vec2_pretrain_large
torchaudio.prototype.models.conformer_wav2vec2_pretrain_model
torchaudio.prototype.models.emformer_hubert_base
torchaudio.prototype.models.emformer_hubert_model
torchaudio.prototype.models.hifigan_vocoder
torchaudio.prototype.models.hifigan_vocoder_v1
torchaudio.prototype.models.hifigan_vocoder_v2
torchaudio.prototype.models.hifigan_vocoder_v3
torchaudio.save
torchaudio.sox_effects.apply_effects_file
torchaudio.sox_effects.apply_effects_tensor
torchaudio.sox_effects.effect_names
torchaudio.utils.ffmpeg_utils.clear_cuda_context_cache
torchaudio.utils.ffmpeg_utils.get_audio_decoders
torchaudio.utils.ffmpeg_utils.get_audio_encoders
torchaudio.utils.ffmpeg_utils.get_build_config
torchaudio.utils.ffmpeg_utils.get_demuxers
torchaudio.utils.ffmpeg_utils.get_input_devices
torchaudio.utils.ffmpeg_utils.get_input_protocols
torchaudio.utils.ffmpeg_utils.get_log_level
torchaudio.utils.ffmpeg_utils.get_muxers
torchaudio.utils.ffmpeg_utils.get_output_devices
torchaudio.utils.ffmpeg_utils.get_output_protocols
torchaudio.utils.ffmpeg_utils.get_versions
torchaudio.utils.ffmpeg_utils.get_video_decoders
torchaudio.utils.ffmpeg_utils.get_video_encoders
torchaudio.utils.ffmpeg_utils.set_log_level
torchaudio.utils.sox_utils.get_buffer_size
torchaudio.utils.sox_utils.list_effects
torchaudio.utils.sox_utils.list_read_formats
torchaudio.utils.sox_utils.list_write_formats
torchaudio.utils.sox_utils.set_buffer_size
torchaudio.utils.sox_utils.set_seed
torchaudio.utils.sox_utils.set_use_threads
torchaudio.utils.sox_utils.set_verbosity
torio.utils.ffmpeg_utils.clear_cuda_context_cache
torio.utils.ffmpeg_utils.get_audio_decoders
torio.utils.ffmpeg_utils.get_audio_encoders
torio.utils.ffmpeg_utils.get_build_config
torio.utils.ffmpeg_utils.get_demuxers
torio.utils.ffmpeg_utils.get_input_devices
torio.utils.ffmpeg_utils.get_input_protocols
torio.utils.ffmpeg_utils.get_log_level
torio.utils.ffmpeg_utils.get_muxers
torio.utils.ffmpeg_utils.get_output_devices
torio.utils.ffmpeg_utils.get_output_protocols
torio.utils.ffmpeg_utils.get_versions
torio.utils.ffmpeg_utils.get_video_decoders
torio.utils.ffmpeg_utils.get_video_encoders
torio.utils.ffmpeg_utils.set_log_level
torio::io::StreamingMediaDecoder::add_audio_stream
torio::io::StreamingMediaDecoder::add_video_stream
torio::io::StreamingMediaDecoder::fill_buffer
torio::io::StreamingMediaDecoder::find_best_audio_stream
torio::io::StreamingMediaDecoder::find_best_video_stream
torio::io::StreamingMediaDecoder::get_metadata
torio::io::StreamingMediaDecoder::get_out_stream_info
torio::io::StreamingMediaDecoder::get_src_stream_info
torio::io::StreamingMediaDecoder::is_buffer_ready
torio::io::StreamingMediaDecoder::num_out_streams
torio::io::StreamingMediaDecoder::num_src_streams
torio::io::StreamingMediaDecoder::pop_chunks
torio::io::StreamingMediaDecoder::process_all_packets
torio::io::StreamingMediaDecoder::process_packet
torio::io::StreamingMediaDecoder::process_packet_block
torio::io::StreamingMediaDecoder::remove_stream
torio::io::StreamingMediaDecoder::seek
torio::io::StreamingMediaDecoderCustomIO::StreamingMediaDecoderCustomIO
torio::io::StreamingMediaEncoder::StreamingMediaEncoder
torio::io::StreamingMediaEncoder::add_audio_stream
torio::io::StreamingMediaEncoder::add_video_stream
torio::io::StreamingMediaEncoder::close
torio::io::StreamingMediaEncoder::flush
torio::io::StreamingMediaEncoder::open
torio::io::StreamingMediaEncoder::set_metadata
torio::io::StreamingMediaEncoder::write_audio_chunk
torio::io::StreamingMediaEncoder::write_video_chunk
torio::io::StreamingMediaEncoderCustomIO::StreamingMediaEncoderCustomIO

Guides

Methods

torchaudio.datasets.CMUARCTIC.__getitem__
torchaudio.datasets.CMUDict.__getitem__
torchaudio.datasets.COMMONVOICE.__getitem__
torchaudio.datasets.DR_VCTK.__getitem__
torchaudio.datasets.FluentSpeechCommands.__getitem__
torchaudio.datasets.FluentSpeechCommands.get_metadata
torchaudio.datasets.GTZAN.__getitem__
torchaudio.datasets.IEMOCAP.__getitem__
torchaudio.datasets.IEMOCAP.get_metadata
torchaudio.datasets.LIBRISPEECH.__getitem__
torchaudio.datasets.LIBRISPEECH.get_metadata
torchaudio.datasets.LIBRITTS.__getitem__
torchaudio.datasets.LJSPEECH.__getitem__
torchaudio.datasets.LibriLightLimited.__getitem__
torchaudio.datasets.LibriMix.__getitem__
torchaudio.datasets.LibriMix.get_metadata
torchaudio.datasets.MUSDB_HQ.__getitem__
torchaudio.datasets.QUESST14.__getitem__
torchaudio.datasets.QUESST14.get_metadata
torchaudio.datasets.SPEECHCOMMANDS.__getitem__
torchaudio.datasets.SPEECHCOMMANDS.get_metadata
torchaudio.datasets.Snips.__getitem__
torchaudio.datasets.Snips.get_metadata
torchaudio.datasets.TEDLIUM.__getitem__
torchaudio.datasets.VCTK_092.__getitem__
torchaudio.datasets.VoxCeleb1Identification.__getitem__
torchaudio.datasets.VoxCeleb1Identification.get_metadata
torchaudio.datasets.VoxCeleb1Verification.__getitem__
torchaudio.datasets.VoxCeleb1Verification.get_metadata
torchaudio.datasets.YESNO.__getitem__
torchaudio.io.AudioEffector.apply
torchaudio.io.AudioEffector.stream
torchaudio.models.Conformer.forward
torchaudio.models.ConvTasNet.forward
torchaudio.models.DeepSpeech.forward
torchaudio.models.Emformer.forward
torchaudio.models.Emformer.infer
torchaudio.models.HDemucs.forward
torchaudio.models.HuBERTPretrainModel.forward
torchaudio.models.RNNT.forward
torchaudio.models.RNNT.join
torchaudio.models.RNNT.predict
torchaudio.models.RNNT.transcribe
torchaudio.models.RNNT.transcribe_streaming
torchaudio.models.RNNTBeamSearch.forward
torchaudio.models.RNNTBeamSearch.infer
torchaudio.models.SquimObjective.forward
torchaudio.models.SquimSubjective.forward
torchaudio.models.Tacotron2.forward
torchaudio.models.Tacotron2.infer
torchaudio.models.Wav2Letter.forward
torchaudio.models.Wav2Vec2Model.extract_features
torchaudio.models.Wav2Vec2Model.forward
torchaudio.models.WaveRNN.forward
torchaudio.models.WaveRNN.infer
torchaudio.models.decoder.CTCDecoder.__call__
torchaudio.models.decoder.CTCDecoder.decode_begin
torchaudio.models.decoder.CTCDecoder.decode_end
torchaudio.models.decoder.CTCDecoder.decode_step
torchaudio.models.decoder.CTCDecoder.get_final_hypothesis
torchaudio.models.decoder.CTCDecoder.idxs_to_tokens
torchaudio.models.decoder.CTCDecoderLM.finish
torchaudio.models.decoder.CTCDecoderLM.score
torchaudio.models.decoder.CTCDecoderLM.start
torchaudio.models.decoder.CTCDecoderLMState.child
torchaudio.models.decoder.CTCDecoderLMState.compare
torchaudio.models.decoder.CUCTCDecoder.__call__
torchaudio.pipelines.RNNTBundle.FeatureExtractor.__call__
torchaudio.pipelines.RNNTBundle.TokenProcessor.__call__
torchaudio.pipelines.RNNTBundle.get_decoder
torchaudio.pipelines.RNNTBundle.get_feature_extractor
torchaudio.pipelines.RNNTBundle.get_streaming_feature_extractor
torchaudio.pipelines.RNNTBundle.get_token_processor
torchaudio.pipelines.SourceSeparationBundle.get_model
torchaudio.pipelines.SquimObjectiveBundle.get_model
torchaudio.pipelines.SquimSubjectiveBundle.get_model
torchaudio.pipelines.Tacotron2TTSBundle.TextProcessor.__call__
torchaudio.pipelines.Tacotron2TTSBundle.Vocoder.__call__
torchaudio.pipelines.Tacotron2TTSBundle.get_tacotron2
torchaudio.pipelines.Tacotron2TTSBundle.get_text_processor
torchaudio.pipelines.Tacotron2TTSBundle.get_vocoder
torchaudio.pipelines.Wav2Vec2ASRBundle.get_labels
torchaudio.pipelines.Wav2Vec2ASRBundle.get_model
torchaudio.pipelines.Wav2Vec2Bundle.get_model
torchaudio.pipelines.Wav2Vec2FABundle.Aligner.__call__
torchaudio.pipelines.Wav2Vec2FABundle.Tokenizer.__call__
torchaudio.pipelines.Wav2Vec2FABundle.get_aligner
torchaudio.pipelines.Wav2Vec2FABundle.get_dict
torchaudio.pipelines.Wav2Vec2FABundle.get_labels
torchaudio.pipelines.Wav2Vec2FABundle.get_model
torchaudio.pipelines.Wav2Vec2FABundle.get_tokenizer
torchaudio.prototype.datasets.Musan.__getitem__
torchaudio.prototype.datasets.Musan.get_metadata
torchaudio.prototype.models.ConformerWav2Vec2PretrainModel.forward
torchaudio.prototype.models.ConvEmformer.forward
torchaudio.prototype.models.ConvEmformer.infer
torchaudio.prototype.models.HiFiGANVocoder.forward
torchaudio.prototype.pipelines.HiFiGANVocoderBundle.get_mel_transform
torchaudio.prototype.pipelines.HiFiGANVocoderBundle.get_vocoder
torchaudio.prototype.pipelines.VGGishBundle.VGGish.forward
torchaudio.prototype.pipelines.VGGishBundle.VGGishInputProcessor.__call__
torchaudio.prototype.pipelines.VGGishBundle.get_input_processor
torchaudio.prototype.pipelines.VGGishBundle.get_model
torchaudio.prototype.transforms.BarkScale.forward
torchaudio.prototype.transforms.BarkSpectrogram.forward
torchaudio.prototype.transforms.ChromaScale.forward
torchaudio.prototype.transforms.ChromaSpectrogram.forward
torchaudio.prototype.transforms.InverseBarkScale.forward
torchaudio.transforms.AddNoise.forward
torchaudio.transforms.AmplitudeToDB.forward
torchaudio.transforms.ComputeDeltas.forward
torchaudio.transforms.Convolve.forward
torchaudio.transforms.Deemphasis.forward
torchaudio.transforms.FFTConvolve.forward
torchaudio.transforms.Fade.forward
torchaudio.transforms.GriffinLim.forward
torchaudio.transforms.InverseMelScale.forward
torchaudio.transforms.InverseSpectrogram.forward
torchaudio.transforms.LFCC.forward
torchaudio.transforms.Loudness.forward
torchaudio.transforms.MFCC.forward
torchaudio.transforms.MVDR.forward
torchaudio.transforms.MelScale.forward
torchaudio.transforms.MelSpectrogram.forward
torchaudio.transforms.MuLawDecoding.forward
torchaudio.transforms.MuLawEncoding.forward
torchaudio.transforms.PSD.forward
torchaudio.transforms.PitchShift.forward
torchaudio.transforms.PitchShift.initialize_parameters
torchaudio.transforms.Preemphasis.forward
torchaudio.transforms.RNNTLoss.forward
torchaudio.transforms.RTFMVDR.forward
torchaudio.transforms.Resample.forward
torchaudio.transforms.SlidingWindowCmn.forward
torchaudio.transforms.SoudenMVDR.forward
torchaudio.transforms.SpectralCentroid.forward
torchaudio.transforms.Spectrogram.forward
torchaudio.transforms.Speed.forward
torchaudio.transforms.SpeedPerturbation.forward
torchaudio.transforms.TimeStretch.forward
torchaudio.transforms.Vad.forward
torchaudio.transforms.Vol.forward
torio.io.StreamingMediaDecoder.add_audio_stream
torio.io.StreamingMediaDecoder.add_basic_audio_stream
torio.io.StreamingMediaDecoder.add_basic_video_stream
torio.io.StreamingMediaDecoder.add_video_stream
torio.io.StreamingMediaDecoder.fill_buffer
torio.io.StreamingMediaDecoder.get_metadata
torio.io.StreamingMediaDecoder.get_out_stream_info
torio.io.StreamingMediaDecoder.get_src_stream_info
torio.io.StreamingMediaDecoder.is_buffer_ready
torio.io.StreamingMediaDecoder.pop_chunks
torio.io.StreamingMediaDecoder.process_all_packets
torio.io.StreamingMediaDecoder.process_packet
torio.io.StreamingMediaDecoder.remove_stream
torio.io.StreamingMediaDecoder.seek
torio.io.StreamingMediaDecoder.stream
torio.io.StreamingMediaEncoder.add_audio_stream
torio.io.StreamingMediaEncoder.add_video_stream
torio.io.StreamingMediaEncoder.close
torio.io.StreamingMediaEncoder.flush
torio.io.StreamingMediaEncoder.open
torio.io.StreamingMediaEncoder.set_metadata
torio.io.StreamingMediaEncoder.write_audio_chunk
torio.io.StreamingMediaEncoder.write_video_chunk

Modules

torchaudio.compliance.kaldi
torchaudio.datasets
torchaudio.functional
torchaudio.io
torchaudio.kaldi_io
torchaudio.models
torchaudio.models.decoder
torchaudio.pipelines
torchaudio.prototype.datasets
torchaudio.prototype.functional
torchaudio.prototype.models
torchaudio.prototype.pipelines
torchaudio.prototype.transforms
torchaudio.sox_effects
torchaudio.transforms
torchaudio.utils
torchaudio.utils.ffmpeg_utils
torchaudio.utils.sox_utils
torio
torio.io
torio.utils
torio.utils.ffmpeg_utils

Propertys

torchaudio.datasets.CMUDict.symbols
torchaudio.datasets.TEDLIUM.phoneme_dict
torchaudio.models.decoder.CTCDecoderLMState.children
torchaudio.pipelines.RNNTBundle.hop_length
torchaudio.pipelines.RNNTBundle.n_fft
torchaudio.pipelines.RNNTBundle.n_mels
torchaudio.pipelines.RNNTBundle.right_context_length
torchaudio.pipelines.RNNTBundle.sample_rate
torchaudio.pipelines.RNNTBundle.segment_length
torchaudio.pipelines.SourceSeparationBundle.sample_rate
torchaudio.pipelines.SquimObjectiveBundle.sample_rate
torchaudio.pipelines.SquimSubjectiveBundle.sample_rate
torchaudio.pipelines.Tacotron2TTSBundle.TextProcessor.tokens
torchaudio.pipelines.Tacotron2TTSBundle.Vocoder.sample_rate
torchaudio.pipelines.Wav2Vec2ASRBundle.sample_rate
torchaudio.pipelines.Wav2Vec2Bundle.sample_rate
torchaudio.pipelines.Wav2Vec2FABundle.sample_rate
torchaudio.prototype.pipelines.HiFiGANVocoderBundle.sample_rate
torchaudio.prototype.pipelines.VGGishBundle.sample_rate
torio.io.StreamingMediaDecoder.default_audio_stream
torio.io.StreamingMediaDecoder.default_video_stream
torio.io.StreamingMediaDecoder.num_out_streams
torio.io.StreamingMediaDecoder.num_src_streams

Sections

Values

torchaudio.models.Hypothesis
torchaudio.pipelines.CONVTASNET_BASE_LIBRI2MIX
torchaudio.pipelines.EMFORMER_RNNT_BASE_LIBRISPEECH
torchaudio.pipelines.HDEMUCS_HIGH_MUSDB
torchaudio.pipelines.HDEMUCS_HIGH_MUSDB_PLUS
torchaudio.pipelines.HUBERT_ASR_LARGE
torchaudio.pipelines.HUBERT_ASR_XLARGE
torchaudio.pipelines.HUBERT_BASE
torchaudio.pipelines.HUBERT_LARGE
torchaudio.pipelines.HUBERT_XLARGE
torchaudio.pipelines.MMS_FA
torchaudio.pipelines.SQUIM_OBJECTIVE
torchaudio.pipelines.SQUIM_SUBJECTIVE
torchaudio.pipelines.TACOTRON2_GRIFFINLIM_CHAR_LJSPEECH
torchaudio.pipelines.TACOTRON2_GRIFFINLIM_PHONE_LJSPEECH
torchaudio.pipelines.TACOTRON2_WAVERNN_CHAR_LJSPEECH
torchaudio.pipelines.TACOTRON2_WAVERNN_PHONE_LJSPEECH
torchaudio.pipelines.VOXPOPULI_ASR_BASE_10K_DE
torchaudio.pipelines.VOXPOPULI_ASR_BASE_10K_EN
torchaudio.pipelines.VOXPOPULI_ASR_BASE_10K_ES
torchaudio.pipelines.VOXPOPULI_ASR_BASE_10K_FR
torchaudio.pipelines.VOXPOPULI_ASR_BASE_10K_IT
torchaudio.pipelines.WAV2VEC2_ASR_BASE_100H
torchaudio.pipelines.WAV2VEC2_ASR_BASE_10M
torchaudio.pipelines.WAV2VEC2_ASR_BASE_960H
torchaudio.pipelines.WAV2VEC2_ASR_LARGE_100H
torchaudio.pipelines.WAV2VEC2_ASR_LARGE_10M
torchaudio.pipelines.WAV2VEC2_ASR_LARGE_960H
torchaudio.pipelines.WAV2VEC2_ASR_LARGE_LV60K_100H
torchaudio.pipelines.WAV2VEC2_ASR_LARGE_LV60K_10M
torchaudio.pipelines.WAV2VEC2_ASR_LARGE_LV60K_960H
torchaudio.pipelines.WAV2VEC2_BASE
torchaudio.pipelines.WAV2VEC2_LARGE
torchaudio.pipelines.WAV2VEC2_LARGE_LV60K
torchaudio.pipelines.WAV2VEC2_XLSR53
torchaudio.pipelines.WAV2VEC2_XLSR_1B
torchaudio.pipelines.WAV2VEC2_XLSR_2B
torchaudio.pipelines.WAV2VEC2_XLSR_300M
torchaudio.pipelines.WAVLM_BASE
torchaudio.pipelines.WAVLM_BASE_PLUS
torchaudio.pipelines.WAVLM_LARGE
torchaudio.prototype.pipelines.EMFORMER_RNNT_BASE_MUSTC
torchaudio.prototype.pipelines.EMFORMER_RNNT_BASE_TEDLIUM3
torchaudio.prototype.pipelines.HIFIGAN_VOCODER_V3_LJSPEECH
torchaudio.prototype.pipelines.VGGISH