Recommending music to new users

(deezer.io)

#data-science #machine-learning #audio-processing

Recreating Natural Voices for People with Speech Impairments

(ai.googleblog.com)

#machine-learning #audio-processing #research

SoundStream: An End-to-End Neural Audio Codec

(ai.googleblog.com)

#machine-learning #audio-processing #compression #research

Integrating with Telephone Networks to Enable Real-Time AI Services

(developer.nvidia.com)

#AI #NLP #real-time #audio-processing

Detecting explicit content in songs

(deezer.io)

#data-science #machine-learning #audio-processing #research

Improving Audio Quality in Duo with WaveNetEQ

(ai.googleblog.com)

#deep-learning #machine-learning #audio-processing #research

How to Deploy Real-Time Text-to-Speech Applications on GPUs Using TensorRT

(devblogs.nvidia.com)

#machine-learning #GPU #audio-processing

LiTr: A lightweight video/audio transcoder for Android

(engineering.linkedin.com)

#mobile #audio-processing #compression #media

The On-Device Machine Learning Behind Recorder

(ai.googleblog.com)

#machine-learning #NLP #audio-processing #research

How to Build Domain Specific Automatic Speech Recognition Models on GPUs

(devblogs.nvidia.com)

#data-science #machine-learning #GPU #audio-processing

Develop Smaller Speech Recognition Models with NVIDIA’s NeMo Framework

(devblogs.nvidia.com)

#machine-learning #GPU #neural-net #audio-processing

DeepSpeech 0.6: Mozilla’s Speech-to-Text Engine Gets Fast, Lean, and Ubiquitous

(hacks.mozilla.org)

#data-science #machine-learning #audio-processing

SPICE: Self-Supervised Pitch Estimation

(ai.googleblog.com)

#data-science #machine-learning #audio-processing #research

Audio and Visual Quality Measurement using Fréchet Distance

(ai.googleblog.com)

#data-science #algorithms #audio-processing #research #video-processing

Large-Scale Multilingual Speech Recognition with a Streaming End-to-End Model

(ai.googleblog.com)

#AI #machine-learning #audio-processing #research

Working with ESP32 Audio Sampling

(www.toptal.com)

#hardware #audio-processing #embedded #systems

Generate Natural Sounding Speech from Text in Real-Time

(devblogs.nvidia.com)

#AI #machine-learning #GPU #audio-processing

Assessing the Quality of Long-Form Synthesized Speech

(ai.googleblog.com)

#QA #machine-learning #audio-processing #research

Joint Speech Recognition and Speaker Diarization via Sequence Transduction

(ai.googleblog.com)

#AI #machine-learning #NLP #audio-processing #research

Project Euphonia’s Personalized Speech Recognition for Non-Standard Speech

(ai.googleblog.com)

#data-science #machine-learning #audio-processing #research

Presentation: Functional Composition

(www.infoq.com)

#functional-programming #audio-processing #clojure

Deep Active Noise Cancellation

(towardsdatascience.com)

#deep-learning #AI #audio-processing #media

Presentation: Deep Learning with Audio Signals: Prepare, Process, Design, Expect

(www.infoq.com)

#deep-learning #data-science #audio-processing #media

Improving Instagram’s Music Audio Quality

(instagram-engineering.com)

#audio-processing #encoding #compression #media

SoundCloud Is Playing the Oboe

(developers.soundcloud.com)

#audio-processing #media #systems #C++

Presentation: wav2letter++: Facebook's Fast Open-source Speech Recognition System

(www.infoq.com)

#deep-learning #data-science #NLP #audio-processing #research

Web Audio for Electric Guitar: How to Connect Instrument

(itnext.io)

#hardware #audio-processing #browsers #web

Speech Emotion Recognition with Convolution Neural Network

(towardsdatascience.com)

#signal-processing #machine-learning #NLP #neural-net #audio-processing

Introducing Translatotron: An End-to-End Speech-to-Speech Translation Model

(ai.googleblog.com)

#data-science #AI #NLP #audio-processing #research

Engineering a Studio Quality Experience With High-Quality Audio at Netflix

(medium.com)

#signal-processing #audio-processing #encoding #media

SpecAugment: A New Data Augmentation Method for Automatic Speech Recognition

(ai.googleblog.com)

#data-science #machine-learning #audio-processing #research

Programming by voice in 2019

(blog.logrocket.com)

#HCI #voice-assistant #audio-processing #bots

How To Make A Speech Synthesis Editor

(www.smashingmagazine.com)

#javascript #audio-processing #web #frontend

An All-Neural On-Device Speech Recognizer

(ai.googleblog.com)

#AI #neural-net #audio-processing #research

Data Visualization in Music

(towardsdatascience.com)

#audio-processing #visualisation #music #design

Implementing AudioWorklets with React

(hackernoon.com)

#reactJS #audio-processing #browsers #web

Classify Songs Genres From Audio Data

(towardsdatascience.com)

#machine-learning #analytics #audio-processing

Real-Time Noise Suppression Using Deep Learning

(towardsdatascience.com)

#deep-learning #signal-processing #AI #GPU #audio-processing

Introducing Wav2latter++

(towardsdatascience.com)

#AI #machine-learning #neural-net #audio-processing

Audio Classification using FastAI and On-the-Fly Frequency Transforms

(towardsdatascience.com)

#deep-learning #AI #python #audio-processing

LPCNet: DSP-Boosted Neural Speech Synthesis

(hacks.mozilla.org)

#signal-processing #neural-net #audio-processing #research

Accurate Online Speaker Diarization with Supervised Learning

(ai.googleblog.com)

#AI #machine-learning #audio-processing #research

WaveNet: Google Assistant’s Voice Synthesizer.

(towardsdatascience.com)

#data-science #AI #NLP #neural-net #audio-processing

Making beats with generative design

(becominghuman.ai)

#data-science #AI #audio-processing #music

Real-Time Noise Suppression Using Deep Learning

(devblogs.nvidia.com)

#deep-learning #algorithms #mobile #real-time #audio-processing

Neural Networks For Music: A Journey Through Its History

(towardsdatascience.com)

#AI #neural-net #audio-processing #history #research

Significantly faster generation and training for AI-based audio systems

(code.fb.com)

#machine-learning #neural-net #audio-processing #research

Introducing Oboe: A C++ library for low latency audio

(android-developers.googleblog.com)

#android #audio-processing #streaming #C++

Mixed Precision Training for NLP and Speech Recognition with OpenSeq2Seq

(devblogs.nvidia.com)

#data-science #NLP #GPU #audio-processing

Speaker Diarization — The Squad Way

(hackernoon.com)

#machine-learning #audio-processing #math

Speech Classification Using Neural Networks: The Basics

(towardsdatascience.com)

#machine-learning #neural-net #audio-processing

Streaming RNNs in TensorFlow

(hacks.mozilla.org)

#AI #neural-net #audio-processing

Google’s Next Generation Music Recognition

(ai.googleblog.com)

#signal-processing #data-science #audio-processing

Synesthesia: The Sound of Style

(multithreaded.stitchfix.com)

#algorithms #audio-processing #research

Generating Music: when simple probabilities outperform neural networks

(towardsdatascience.com)

#machine-learning #audio-processing #probability

Into a better Speech Synthesis Technology

(becominghuman.ai)

#signal-processing #AI #audio-processing #research

Algorithmic Reverb and Web Audio API

(itnext.io)

#signal-processing #algorithms #audio-processing #web

Hacking Facebook: Audio Focus for 360 Video

(hackernoon.com)

#audio-processing #VR #video-processing

Facebook researchers use AI to turn whistles into orchestral music, and power other musical “translations”

(research.fb.com)

#AI #machine-learning #audio-processing

Expressive Speech Synthesis with Tacotron

(ai.googleblog.com)

#machine-learning #algorithms #audio-processing

Looking to Listen: Audio-Visual Speech Separation

(ai.googleblog.com)

#data-science #audio-processing #research #video-processing

Nv-Wavenet: Better Speech Synthesis Using GPU-Enabled WaveNet Inference

(devblogs.nvidia.com)

#hardware #GPU #audio-processing

Looking to Listen: Audio-Visual Speech Separation

(research.googleblog.com)

#deep-learning #AI #audio-processing #video-processing

Visualizing Beethoven’s Oeuvre, Part I: Scraping and cleaning data from IMSLP

(towardsdatascience.com)

#data-science #python #audio-processing

Expressive Speech Synthesis with Tacotron

(research.googleblog.com)

#machine-learning #audio-processing #research

What’s wrong with spectrograms and CNNs for audio processing?

(towardsdatascience.com)

#machine-learning #neural-net #audio-processing

Getting Started With The Web MIDI API

(www.smashingmagazine.com)

#audio-processing #web #MIDI

How to do Real Time Trigger Word Detection with Keras

(hackernoon.com)

#machine-learning #audio-processing #keras

Neural Voice Cloning with a Few Samples

(research.baidu.com)

#deep-learning #machine-learning #audio-processing #research

How To Build An Audio Processor In Your Browser

(hackernoon.com)

#software-architecture #algorithms #audio-processing #web

The promise of AI in audio processing

(towardsdatascience.com)

#AI #machine-learning #audio-processing

Tacotron 2: Generating Human-like Speech from Text

(research.googleblog.com)

#machine-learning #neural-net #audio-processing #research

Improving End-to-End Models For Speech Recognition

(research.googleblog.com)

#machine-learning #audio-processing #research

Machine Learning WAVE Files with TensorFlow

(becominghuman.ai)

#deep-learning #machine-learning #tensor-flow #audio-processing

A Journey to <10% Word Error Rate

(hacks.mozilla.org)

#machine-learning #NLP #audio-processing

Web Audio API Series 1 — Introduction

(hackernoon.com)

#javascript #audio-processing #web

Deep Speech 3：Exploring Neural Transducers for End-to-End Speech Recognition

(research.baidu.com)

#AI #machine-learning #neural-net #audio-processing #research

Humming with the bot

(blog.buildo.io)

#machine-learning #audio-processing #bots

RNNoise: Using Deep Learning for Noise Suppression

(hacks.mozilla.org)

#deep-learning #machine-learning #neural-net #audio-processing

Introduction to the SHMAVPlayerInterface

(tech.showmax.com)

#ios #swift #audio-processing #music

A Brief Introduction to Audio and Video Encoding

(spin.atomicobject.com)

#audio-processing #encoding

Tagged | audio-processing