Требуется, например, звук глотания отличить от кашля. Думаю, что можно создать "идеальные" аудиофайлы, но как сравнить их с вновь записанными? Все что вижу в инете связано с распознаванием речи и уже под это заточено. Есть ли что-то для сравнения двух аудиофайлов и определения их похожести?
Ответ Хотя данный вопрос подразумевает ответ, который невозможно дать однозначно, но можно наметить примерный путь поисков. По крайней мере вы будете знать с чего начать и куда стоит двигаться для достижения цели. Для самого начала стоит обратится к изучению аналогово-цифрового преобразования звука и узнать, как вообще звук представляется в дискретном состоянии и какие параметры в него входят. Так же можно изучить аналоговые и дискретные звуковые преобразования. Так вы сможете ознакомится с довольно интересной природой звука и что он из себя представляет.
После этого, вы должны составить для себя список, какие факторы можно использовать для определения различий между требуемым списком звуковых сигналов. Это может быть в простом случае один фактор, в сложных целая сеть различных характеристик сигнала и всевозможных алгоритмов обработки. Кстати много много названий характеристик в вики, можно их посмотреть и изучить спектральный анализ звука. В любом случае Вам понадобится собрать базу данных из таких слепков и сравнивать ее между собой для анализа и проектирования программы. Далее вы пишите программу, которая сможет анализировать входящие сигналы и путем сравнения выдавать оценочный результат. Вам не нужно создавать идеальные файлы и сравнивать, Вам нужно создать допустимые плавающие границы для входных сигналов. Примерно так и работают искусственные сети, обучаясь на формировании оценочных признаков и их диапазонов в базе данных. Примерно так Вы сможете создать очень примитивную, но зато свою, систему распознавания.